Thèse d’Aurélie Lemaitre

Introduction de la vision perceptive pour la reconnaissance de la structure de documents

Soutenue le 5 décembre 2008

Résumé :

La vision perceptive humaine combine différents niveaux de perception pour faciliter l’interprétation d’une scène. Les physiologistes la modélisent par le cycle perceptif, guidé par un facteur psychologique, l’attention visuelle.

Nous proposons d’utiliser ce principe pour la reconnaissance d’images de documents anciens et manuscrits.
Dans ce contexte, nous proposons une architecture générique, DMOS-P, permettant de spécifier des mécanismes de coopération perceptive à la demande, qui facilitent la description et améliorent la reconnaissance de la structure de documents.

Dans les applications, nous mettons en évidence un mécanisme de prédiction/vérification : la vision à basse résolution permet d’émettre des hypothèses sur la structure en utilisant le contexte global, qui ces hypothèses sont ensuite vérifiées à plus haute résolution. Nous avons validé cette approche sur des documents à structure variée (courriers manuscrits, registres d’archives, presse…), à grande échelle (plus de 80 000 images), et par le biais d’un transfert industriel.

 

  • Aurélie Lemaitre. Introduction de la vision perceptive pour la reconnaissance de la structure de documents. Thèse de l’INSA de Rennes, Décembre 2008. download

 

Composition du jury :

  • Rolf Ingold – Professeur à l’Université de Fribourg (rapporteur)
  • Thierry Paquet – Professeur à l’Université de Rouen (rapporteur)
  • Laurence Likforman – Professeur associé à Telecom ParisTech (examinateur)
  • Josep Llados – Professeur associé à l’Université de Barcelone (examinateur)
  • Jean Camillerapp – Professeur à l’INSA de Rennes (directeur)
  • Bertrand Coüasnon – Maître de conférences à l’INSA de Rennes (encadrant)