Indexation de documents anciens
Journée Jeunes Chercheurs - S.A. 5.2 et GRCE - Tours - Juin 2003
Mon travail de thèse s'intègre dans un projet plus vaste qui vise à développer une chaîne auto apprenante de traitement des documents anciens. L'innovation du projet réside dans la synthèse et la mise en concurrence des différentes méthodes de classification et de segmentation. Le contenu scientifique de mon travail est axé principalement autour des trois phases suivantes :
- La segmentation hiérarchique du document et le choix de critères de forme. Nous voulons aller vers la mise en concurrence de méthodes et de critères. Il nous semble judicieux également, compte tenu de la difficulté à segmenter les documents anciens, de s'orienter vers une segmentation hiérarchique qui permette une reconnaissance adaptative.
- La reconnaissance. Nous voulons là encore essayer de mettre en concurrence différentes approches standards de classification et faire évoluer les performances en introduisant en permanence des boucles de rétroaction.
- L’apprentissage. Pour cette phase nous voulons mettre en place des règles simples l'apprentissage utilisables pour toutes sortes de documents.
Je me propose de présenter les trois problématiques et d'orienter la discussion sur celle de la segmentation et du choix des critères de forme.
Références BibTex
@Misc{A2003_713,
}
author | = {Arrivault, D.}, | |
title | = {Indexation de documents anciens.}, | |
month | = {Juin}, | |
year | = {2003}, | |
note | = {Journ\'ee Jeunes Chercheurs - S.A. 5.2 et GRCE - Tours}, |