Interprétation contextuelle et assistée de fonds d’archives numérisés : application à des registres de vente du XVIIIe siècle
Soutenue le mercredi 9 janvier 2013
Sujet
Les fonds d’archives forment de grandes quantités de documents difficiles à interpréter automatiquement : les approches classiques imposent un lourd effort de conception, sans parvenir à empêcher la production d’erreurs qu’il faut corriger après les traitements.
Face à ces limites, notre travail vise à améliorer la processus d’interprétation, en conservant un fonctionnement page par page, et en lui apportant des informations contextuelles extraites du fonds documentaire ou fournies par des opérateurs humains.
Nous proposons une extension ciblée de la description d’une page qui permet la mise en place systématique d’échanges entre le processus d’interprétation et son environnement. Un mécanisme global itératif gère l’apport progressif d’informations contextuelles à ce processus, ce qui améliore l’interprétation.
L’utilisation de ces nouveaux outils pour le traitement de documents du XVIIIe siècle a montré qu’il était facile d’intégrer nos propositions à un système existant, que sa conception restait simple, et que l’effort de correction pouvait être diminué.
- Joseph Chazalon. Interprétation contextuelle et assistée de fonds d’archives numérisés : application à des registres de vente du XVIIIe siècle. Thèse de l’INSA de Rennes, Janvier 2013. download
Jury
– Jean-Marc OGIER, Professeur à l’université de La Rochelle, Président et rapporteur
– Josep LLADÓS, Associate Professor à l’Universitat Autònoma de Barcelona (Espagne), Rapporteur
– Rolf INGOLD, Professeur à l’université de Fribourg (Suisse), Examinateur
– Christopher KERMORVANT, Responsable R&D chez A2iA, Examinateur
– Jean CAMILLERAPP, Professeur à l’INSA de Rennes, Directeur
– Bertrand COÜASNON, Maître de conférence à l’INSA de Rennes (HDR), Encadrant