Forage conceptuel (LATAO)

Projet : Le forage conceptuel de textes assisté par ordinateur

Chercheur principal : Jean-Guy Meunier

Période : 2012-2017

Organisme subventionnaire : Conseil de recherches en sciences humaines du Canada (CRSH)

Titre du programme : Subvention savoir

 

Résumé :

Contexte et objectifs généraux du projet.

Secteur d’activité le plus dynamique du commerce mondial actuel, l’économie numérique et la technologie informatique qui lui est associée pénètrent et transforment l’univers des lettres, des sciences humaines et sociales ainsi que différents domaines professionnels comme le journalisme, le droit, l’édition, la bibliothéconomie. Au cœur de ces changements, opère une modification radicale du rapport de ces différents experts au texte, principalement due à l’ampleur de sa numérisation. Sur le plan de la recherche, cette modification s’est notamment manifestée par l’émergence d’une famille de méthodes appelée la lecture et l’analyse de texte assistées par ordinateur (LATAO).

Le présent projet vise à contribuer à la compréhension, au développement et à la validation de cette famille de méthodes informatiques. Il propose une nouvelle méthode originale de lecture et d’analyse conceptuelle de textes assistées par ordinateur (LACTAO 2.0), basée sur une fonction de forage conceptuel.

Volet I: Étudier les fondements théoriques de l’analyse conceptuelle.

L’analyse conceptuelle désigne un processus d’interprétation de l’organisation et de la dynamique internes d’un concept au sein d’un corpus de texte. Elle est essentielle au travail intellectuel des experts du monde académique et professionnel. Elle s’avère cependant être une pratique polymorphe, qui varie en fonction des théories du concept interpellées pour la fonder. Cela, notamment, dans la compréhension que ces théories ont de la relation entre le concept et son expression linguistique dans un texte.

Volet II: Développer une méthode de forage conceptuel.

Cette méthode a pour objectif d’extraire automatiquement d’un corpus les expressions linguistiques et les énoncés dans lesquels un concept cible se manifeste et d’en modéliser l’organisation interne sous la forme d’un réseau. Cette méthode permet d’assister le processus interprétatif qu’un lecteur met en œuvre dans son analyse d’un concept cible dans un corpus. Elle prend la forme d’une chaîne de traitement informatique modulaire. Plusieurs études de cas empiriques sont prévues pour valider la méthode.

Volet III : Implémenter un prototype informatique.

La LACTAO 2.0 nécessite une plate-forme informatique où seront implémentés, exécutés et évalués les différents algorithmes nécessaires à l’étude : segmentation de texte, d’indexation, classification automatique, etc. Ceci est réalisable sur une plate-forme flexible avec inter-opérationnalité des modules. On peut ainsi construire rapidement et expérimenter différentes stratégies de forage conceptuel, et si possible, les mettent à la disposition de la communauté.

Portée de la recherche.

a) Il apporte une solution technologique originale qui, d’une part, va au-delà des technologies traditionnelles d’assistance à lecture et d’analyse de textes et, d’autre part, s’avère beaucoup plus sensible aux besoins et usages du traitement des données textuelles que d’autres grandes plates-formes de fouille de données (WEKA, RapidMiner, Orange, etc.).

b) Il vise à encourager l’utilisation de l’informatique par la communauté des experts lecteurs des sciences humaines en leur offrant une technologie très proche de leur pratique interprétative effective.

c) Il cherche à rendre la méthode accessible aux étudiants, tant à des fins de formation que de recherche. La plate-forme construite dans le projet permettra aux étudiants de s’approprier un univers technologique incontournable dans le contexte de l’économie numérique où l’information circule sous forme textuelle.

En somme, dans le contexte de l’économie numérique, les solutions théoriques, méthodologiques et technologiques proposées par le projet apparaissent tout aussi importantes qu’urgentes.