Thèse de Solène Tarride

Soutenue le 11 avril 2022

Combinaison de connaissances logiques et textuelles pour la reconnaissance d’images de registres anciens

Résumé

Cette thèse CIFRE est une collaboration entre Doptim et l’IRISA, dans le cadre du
contrat ANRT n°2018/0896. Nos travaux portent sur la reconnaissance de registres de
population français datant du XVIè au XVIIIè siècle : les registres paroissiaux. Ces documents
sont structurés en actes de baptême, mariage et sépulture et contiennent donc des
informations importantes pour les généalogistes souhaitant retracer leur histoire familiale.
Les outils développés dans cette thèse sont destinés à enrichir Geneafinder, le site de
généalogie développé par Doptim. Nos contributions pour la reconnaissance de registres
paroissiaux s’articulent en trois axes.
Le premier axe porte sur la reconnaissance de la structure de ces registres. Nous proposons
une méthode hybride capable de découper ces documents en actes, en s’appuyant
sur l’apprentissage de motifs structurels (signatures, lignes de texte, bords de pages) et sur
le groupement logique de ces motifs à l’aide de règles. Nous démontrons l’intérêt de cette
approche dans un contexte où peu de documents sont disponibles pour l’apprentissage.
Le deuxième axe adresse la reconnaissance du contenu textuel de ces documents, dans
le but d’identifier les mots importants présents dans les actes : la date, les noms, les prénoms,
ou encore les métiers. Nous adaptons une architecture neuronale avec mécanisme
d’attention pour la reconnaissance d’écriture manuscrite, et démontrons l’intérêt de ce
mécanisme pour la reconnaissance conjointe d’écriture manuscrite et d’entités nommées.
Nous proposons également différentes stratégies d’apprentissage basées sur cette architecture.
Le troisième axe s’articule autour de la génération de documents synthétiques. Nous
proposons une méthode pour générer des actes synthétiques, en modélisant les structures
de phrases récurrentes des actes et en implémentant des transformations permettant de
déformer et dégrader les images générées grâce à des polices manuscrites. Nous montrons
l’intérêt de cette approche pour réduire le besoin en transcriptions manuelles, qui est un
enjeu majeur de ce travail.

Composition du jury

 

Nicholas JOURNET Maître de Conférences (HDR) à l’Université de Bordeaux, rapporteur
Thierry PAQUET Professeur à l’Université de Rouen Normandie, rapporteur
Véronique EGLIN Professeur à l’INSA Lyon, examinatrice
Josep LLADÓS Professeur associé à l’Université Autonome de Barcelone, examinateur
Harold MOUCHERE Professeur à l’Université de Nantes, examinateur
Jean-Yves RAMEL Professeur à l’Université de Tours, examinateur
Bertrand COUASNON Maître de conférence (HDR) à l’INSA de Rennes, directeur de thèse
Aurélie LEMAITRE Maître de conférence (HDR) à l’Université de Rennes 2, co-encadrante