Samuel Coavoux, ingénieur chez Orange Labs, assurera un atelier pour les chercheurs de l'OBVIL sur le sujet de l'anlayse lexicométrique de textes (Topic Modeling).
L'atelier aura lieu le 22 mars à la Maison de la recherche, de 14h à 18h (salle D117).
Résumé: Le topic model est une famille de techniques de lexicométrie visant à classifier automatiquement des documents. Dans cette séance, je propose de présenter un exemple de recherche original employant cette technique, qui sera suivie d’un tutoriel informatique pour la mettre en pratique avec le logiciel R. La recherche porte sur la critique culturelle. Dans le cadre d’une thèse de doctorat portant sur la réception d’un tableau de Nicolas Poussin, la fuite en Égypte (1658), j’ai collecté l’ensemble des articles de la presse française portant sur ce tableau, qui a connu une histoire mouvementée depuis sa découverte en 1986 jusqu’à son achat en 2007 par le musée des beaux-arts de Lyon. L’approche lexicométrique permet de mettre en évidence, à travers cet exemple, les ressorts du l’attention médiatique pour l’art. Pour la partie logiciel : il faudrait installer le langage de programmation R https://www.r-project.org et le logiciel Rstudio https://www.rstudio.com/ ; puis, d’installer dans R les packages suivants : topicmodels, quanteda, tidyverse. Je parlerais également d’autres packages, mais ils ne sont pas nécessaires dans un premier temps.
Séminaire organisé par Motasem Alrahabi.