Les textes, les documents visuels, le son et la technologie (LATAO)
Projet : Les textes, les documents visuels, le son et la technologie
Chercheur principal : Jean-Guy Meunier
Période : 2007-2008
Organisme subventionnaire : Conseil de recherches en sciences humaines du Canada (CRSH)
Titre du programme : Subvention de recherche stratégique
Résumé :
Depuis une cinquantaine d’années, la technologie informatique a pénétré les méthodes de lecture et d’analyse effectuées par la communauté des chercheurs de plusieurs disciplines des sciences humaines. Ce projet visait deux objectifs interreliés A) identifier les modules logiciels utilisables dans la lecture et l’analyse de texte lorsqu’elle est assistée par ordinateur (LATAO) et B) de construire le prototype d’une plateforme informatique pouvant gérer et appliquer ces modules.
Relativement au premier objectif, de multiples modules de LATAO ont été identifiés. Cependant, au fur et à mesure des recherches d’importantes limites à la forme classique de LATAO furent découvertes. En effet, celle-ci demeurait trop générale pour les lecteurs experts. Aussi, le projet a-t-il raffiné la méthodologie et les outils pour la transformer en Lecture et analyse conceptuelle assistée par ordinateur (LACTAO). Au lieu de fouiller un texte dans sa globalité, cette méthode ciblait une thématique ou un concept spécifique pour en révéler comment dans un texte se développaient ses multiples contenus informationnels. Par exemple comment se déploie le concept d’EVOLUTION dans l’Origine des espèces de Darwin? Une telle approche plus ciblée sur une problématique et un concept impliquait l’identification de nouveaux modules et une transformation importante de sa chaine de traitement. Ceci exigeait notamment l’introduction d’analyseurs linguistiques, de concordanciers et d’itération de classifieurs, etc. Plusieurs publications ont démontré la pertinence d’une telle approche.
Relativement au deuxième objectif, un prototype de la plateforme modulaire pouvant recevoir, gérer et appliquer les divers modules pour LATAO et LACTAO fut développé et mis sur un site web (www. SATIM.com). Mais ce site n’est plus fonctionnel.
Cette plate-forme était disponible aux chercheurs travaillant en LATAO. Cette plateforme contenait deux composantes :
1. Un atelier. Celui-ci est le reposoir des données et une boîte à outils. On y trouve des modules pouvant être intégrés dans des chaînes de traitement. Pour permettre la communication et l’interaction entre ceux-ci, des passerelles furent construites. L’effort de recherche a consisté à concevoir formellement et à implémenter informatiquement cette architecture.
2. Un laboratoire. Celui-ci est surtout destiné au créateur de méthodologies en LATAO. En raison des limites du financement, seul un ensemble de fonctions très ciblées a été créé. Il portait sur l’assemblage et les interfaces pour la création, l’exploration et l’expérimentation d’une chaîne de traitement : l’assistance à l’extraction du vocabulaire pertinent à la maintenance des concepts dans une ontologie.
Pour que cette plateforme soit accessible à un grand public, il aurait fallu la rendre plus robuste, en expérimenter la validité sur de nombreux corpus et enfin développer des interfaces plus ergonomiques. Le financement réduit de 50% ne permettait pas un tel développement. Pour assurer la réalisation effective des objectifs, le projet les a associés avec les autres projets de recherche (CRSH et FQRSC) liés à des problématiques similaires, mais où la dimension informatique était moins présente. Le projet a permis la formation de plusieurs étudiants doctorants dans le domaine de cette haute technologie