Base de données en-ligne IME-OnDB

Présentation

La base de données IME-OnDB contient des données manuscrites saisies en-ligne dans le contexte d’un logiciel de saisie et d’édition de texte manuscrit.
Elle peut être utilisée pour entrainer et tester des systèmes de reconnaissance de gestes manuscrits, et en particulier pour évaluer la qualité de techniques de positionnement relatif de tracés.
Les échantillons vont par paire de deux objets. Le premier objet est une lettre manuscrite, de l’alphabet latin. Le second objet est un signe diacritique (accent, cédille, trëmas), un
signe de ponctuation (virgule, point) ou un geste d’édition prédéfini pour déclencher une commande de l’éditeur de texte manuscrit.
Ces données ont été saisies sur pocket PC.

La base contient 18 classes de données. La classe d’une paire d’exemple correspond à la classe de l’objet argument (par exemple: accent aigu, accent grave, virugle, etc).
Le protocole d’acquisition de la collection est décrit plus précisément dans les fichiers joints (fichier dataset_infos.txt, dans le fichier zip).

 

La base de donnée contient des gestes manuscrits mono-tracés, stockés dans un format ASCII simple.
Les fichiers contiennent également des informations sur le scripteur et la transcription. Pour plus d’informations, voir le fichier dataset_infos.txt, dans le fichier zip.

Caractéristiques

La base ACCENT-OnDB est composée de (au 26/09/2011) :

15 scripteurs
18 classes de gestes
5525 enregistrements (paire: référence, argument)

Téléchargement

La base de données peut être téléchargée sous forme d’un fichier zip contenant toutes les données ainsi que les fichiers d’informations décrivant les données collectées.
Cliquer ici pour télécharger le fichier zip.

Contact

Pour toute question ou suggestion, vous pouvez contacter Eric Anquetil.