2010

Appliquer les méthodes de la statistique textuelle

Bénédicte Garnier et France Guérin-Pace

Analyser les réponses à une question ouverte, un corpus d’entretiens ou de textes est une pratique courante en sciences sociales. Cette exploration peut être facilitée par des logiciels d’aide à la lecture ou à la codification. Si l’on veut enrichir l’exploitation afin de saisir le sens d’un corpus et en quantifier le contenu, il est nécessaire de recourir à des outils spécifiques.

Les méthodes de la statistique textuelle décrites dans ce manuel permettent de traiter les textes comme des variables particulières au moyen des outils classiques de l’analyse de données.

Nées dans les années 1980 de la rencontre entre plusieurs disciplines (linguistique, statistique, informa¬tique, traitement des enquêtes, etc.), la statistique textuelle trouve aujourd’hui des applications dans des domaines de recherche extrêmement variés (linguistique, histoire, sociologie, géographie, démographie, marketing, etc.) et de plus en plus étendus. Elle fait l’objet des Journées d’Analyse statistique des Données Textuelles (JADT) qui se tiennent tous les deux ans et présentent les avancées dans ce domaine.

Ce manuel s’adresse à tous ceux qui sont amenés à traiter des données recueillies sous forme de textes, quel que soit leur niveau de connaissances en statistique. Il présente de manière didactique les éléments clefs de la statistique textuelle et sa mise en œuvre à partir de logiciels qui font référence dans ce domaine (Spad, Alceste, Lexico) illustrée par des exemples.

Bénédicte GARNIER est ingénieure au Service Méthodes Statistiques de l’Ined. Elle dispense quoti¬diennement des conseils en méthodologie, dans l’utilisation de logiciels de statistique textuelle et plus largement de l’analyse exploratoire multivariée. Elle utilise ces méthodes dans plusieurs projets de recherche auxquels elle collabore et les enseigne régulièrement.

France GUÉRIN-PACE est directrice de recherche à l’Ined. Géographe et statisticienne, elle a participé à l’élaboration d’enquêtes sur des thèmes très variés (environnement illettrisme, identités, mobilités, etc.). C’est dans ce cadre qu’elle a expérimenté les méthodes de la statistique textuelle et qu’elle en a initié l’usage à l’Ined. Elle enseigne ces méthodes en Mastère depuis de nombreuses années.