Inscriptions
Descriptif
Comment industrialiser l’extraction de données de masse et garantir la conformité de l’information ?
Méthodes et technologies Numen appliquées au projet de mise en Open Data des comptes annuels du RNCS de l’INPI
Numen est le prestataire de l’INPI pour l’extraction des comptes annuels du RNCS mis en Open Data depuis janvier dernier. La nature partiellement structurée des liasses fiscales et la qualité variable des images numérisées sont caractéristiques du flux traité (volume annuel excédant 1.2 millions de liasses). Pour faire face à ces enjeux, Numen a mis en œuvre des méthodes originales d’extraction et de contrôle qualité des données chiffrées (états financiers) et des méta-données descriptives des comptes, dans un contexte fortement industrialisé. Cette conférence présentera l’essentiel des choix méthodologiques et techniques retenus.
Intervenant : François CHAHUNEAU, directeur des technologies du groupe Numen