PAGE ACCUEIL

Entretien avec Suzanne Mpouli et Marine Riguet

14 Novembre 2016

Entretien avec Suzanne Mpouli et Marine Riguet

Suzanne Mpouli vient de soutenir une thèse préparée dans le cadre du labex OBVIL sous la direction de Jean-Gabriel Ganascia (Automatic Annotation of Similes in Literary Texts). Marine Riguet est doctorante au labex OBVIL sous la direction de Didier Alexandre et Jean-Gabriel Ganascia (La Littérature laboratoire (1850-1914) : du modèle scientifique à la reconquête de l'objet littéraire). À la conférence Digital Humanities 2016, elles ont remporté le prix Paul Fortier pour une communication intitulée « À la croisée des discours littéraire et scientifique : la comparaison comme haute figure dialogique ». Elles reviennent sur leur parcours, et nous exposent leur méthode et les résultats de leurs travaux.

Comment en êtes-vous venues à intégrer l’OBVIL ?

Suzanne Mpouli

J’ai fait un master en psycholinguistique computationnelle à l’université d’Anvers, dans le cadre duquel j’ai travaillé sur la classification automatique des textes littéraires selon leur genre (roman picaresque, Bildungsroman, roman social, roman psychologique, etc.) et leur « qualité » (œuvres considérées comme plus ou moins prestigieuses). L’idée principale était de sortir des sentiers battus de la stylométrie et d’appliquer à la classification des paramètres un peu plus littéraires, comme les figures de style ou les champs lexicaux. Pour cela, je me suis inspirée du structuralisme russe. J’ai ensuite décidé de continuer en doctorat, et, suite à un appel à candidature de l’OBVIL, j’ai postulé pour un contrat doctoral et j’ai été retenue.

Marine Riguet

C’est vraiment un hasard de parcours. Ce qui m’intéressait initialement, c’était la poésie du début du XXe siècle, et notamment Pierre-Jean Jouve, sur lequel j’ai écrit un mémoire de master. Et puis finalement, au fil de discussions, je me suis orientée vers un sujet plus interdisciplinaire. C’est ainsi que nous avons discuté avec Didier Alexandre d’une thèse sur l’influence des sciences dans la critique littéraire du XIXe siècle. Cela invitait à travailler sur un corpus gigantesque, qui comprend actuellement 400 titres sur près d’un demi-siècle. C’était un projet assez ambitieux, qui ne pouvait pas être traité par les méthodes de recherche traditionnelles. Je n’avais pas d’affinité particulière avec le domaine informatique, mais j’étais curieuse, et quand Didier Alexandre m’a proposé d’intégrer le labex pour utiliser des nouvelles méthodes et outils permis par le numérique, cela m’a bien sûr intéressée.

Pourriez-vous revenir plus en détail sur votre objet d’étude ?

Suzanne Mpouli

J’ai continué dans la lignée de mon master, mais en me focalisant sur l’extraction automatique des comparaisons figuratives dans les textes littéraires. L’idée était de pouvoir les identifier automatiquement dans un texte (en distinguant notamment le comparant, le comparé et le motif de la comparaison) et surtout d’apporter une dimension stylistique à l’analyse : dire comment elles sont formées, donner les catégories sémantiques des termes comparés, etc. Par exemple, j’ai travaillé sur les comparaisons stéréotypées dans les romans du XIXe et du XXe siècle, qui sont très souvent centrées sur les parties du corps humains (des dents blanches comme des perles, une voix basse comme un souffle). J’ai aussi travaillé sur les comparaisons de couleur en anglais, ce qui m’a permis de confirmer qu’avec la venue du modernisme au XXe siècle, on observe une plus grande utilisation de la couleur et aussi une plus grande créativité. Enfin, j’ai étudié l’utilisation des noms propres de personne dans les comparaisons. Pour comparer, il faut introduire quelque chose que le lecteur connaisse. Cela veut dire que les personnes et les personnages qui servent de comparants  bénéficient d’un statut supérieur à d’autres et appartiennent à un canon qui se perpétue à travers la tradition littéraire. On retrouve par exemple beaucoup de personnages de l’Iliade et de l’Odyssée, de la Bible, mais aussi Robinson Crusoé, des personnages de Shakespeare ou d’Alice au pays des merveilles, etc.

Marine Riguet

Je pars de l’hypothèse qu’un nouveau discours sur la littérature apparaît au milieu du XIXe siècle. Auparavant, il y avait certes des critiques littéraires, mais non un discours unifié, légitimé et identifié comme tel. À partir du milieu du XIXe siècle on assiste à la revendication d’un discours critique, qui, pour se légitimer, emprunte des modèles, des notions et une méthode aux sciences exactes. Cette entreprise est comparable à celle de la psychologie et de la sociologie qui tentent à la même époque d’asseoir leur positivité sous l’égide de la physiologie et de la médecine. C’est une période que je situe, grosso modo, entre Sainte-Beuve et Lanson. Il s’agit donc de comprendre de quelle façon se construit pour la première fois un discours qui ne se veut plus seulement esthétique et éthique mais “scientifique”, en rupture avec le modèle classique et le mythe romantique. L’histoire de la critique que l’on connaît a contribué à minorer ou fustiger la critique dite positiviste. On est resté sur la lecture de Sainte-Beuve par Proust. Elle a aussi entériné une catégorisation outrée des mouvements critiques : pour la période 1850-1900, on n’hésite pas à distinguer une critique positiviste, impressionniste, symboliste, dogmatique, hédoniste, apologétique, morale, etc. Ce que je trouve intéressant, c’est d’adopter une approche plus nuancée par delà ces étiquettes figées, qui ne rendent pas justice à la portée du discours critique de l’époque, particulièrement riche.

Le croisement avec les humanités numériques fait alors d’autant plus sens qu’il crée une sorte de mise en abyme de la réflexion méthodologique. J’étudie une critique littéraire qui se situe dans une démarche expérimentale, et qui insiste sur le besoin d’une méthode pour encadrer, justifier et cautionner l’interprétation. Or c’est aussi dans cette démarche que nous nous inscrivons nous-mêmes quand nous recourons aux outils numériques et que nous nous interrogeons sur leurs usages, en remettant en question nos pratiques habituelles et en tentant d’appuyer la recherche littéraire par des apports statistiques, quantitatifs, et numériques. C’est à se demander si le discours critique ne reste pas hanté par un mal de légitimité perpétuel.

Suzanne, tu as également développé un projet collaboratif de crowdsourcing pour le repérage et l’annotation des comparaisons figuratives…

Suzanne Mpouli

L’idée était d’utiliser des comparaisons repérées manuellement par d’autres personnes afin de pouvoir valider l’algorithme d’extraction automatique en comparant les résultats. Ce besoin rejoignait celui de mon collègue Mihnea Tufis, qui travaille sur l’annotation des bandes dessinées. Nous avons travaillé conjointement et nous avons décidé de mettre en place un projet de crowdsourcing où les utilisateurs seraient invités à annoter les comparaisons. Pour ce projet, j’ai choisi un corpus de poèmes en prose, qui sont généralement assez courts, parce que je voulais que les gens puissent les lire en entier, et ne pas leur faire annoter des extraits de romans pris hors contexte.

Comment vous situez-vous dans le domaine des humanités numériques ? Quels sont vos hypothèses théoriques et méthodologiques ?

Marine Riguet

Notre génération de jeunes chercheurs en humanités numériques est dans une position particulière, parce que nous sommes d’une certaine façon des pionniers, sans être pour autant des innovateurs : la théorie de l’analyse automatique du discours, par exemple, remonte à Pêcheux dans les années 1970, et à ce titre, nous ne pouvons prétendre à une approche révolutionnaire. Mais nous sommes en train de défricher le domaine en utilisant des algorithmes et des outils qui se développent très vite, pris dans une innovation permanente. Le plus important reste la réflexion méthodologique. Nous nous approprions des techniques et nous prenons le relais de travaux antérieurs, mais en même temps nous devons poser une distance critique et nous interroger sur la façon d’articuler qualitatif et quantitatif dans le domaine littéraire.

Suzanne Mpouli

À mon sens, les humanités numériques peuvent apporter un peu plus de poids à la recherche en littérature. Quelqu’un peut lire un texte et en penser une certaine chose, tandis qu’une autre personne l’interprétera d’une manière totalement différente, même si l’on s’appuie sur des arguments textuels ou stylistiques. Les humanités numériques permettent d’apporter des arguments quantitatifs qui ne sont plus subjectifs, même s’il reste évidemment une part d’interprétation subjective. Je vois aussi les humanités numériques comme un outil qui permet de faciliter le travail du chercheur. Par exemple, beaucoup de personnes qui travaillent sur le repérage de motifs le font encore manuellement, alors qu’elles pourraient le faire plus facilement automatiquement. Enfin, un de mes chevaux de bataille, c’est d’essayer de sortir de la lignée stylométrique, c’est-à-dire d’une approche purement quantitative (où l’on compte les mots les plus fréquents, où l’on calcule la longueur des phrases, etc.). Je ne dis pas que c’est mauvais en soi, mais ce sont des mesures qui, pour le littéraire traditionnel, n’ont pas un grand intérêt. Le style englobe bien plus de choses (comme les connotations) que l’on est de plus en plus en train d’inclure dans nos travaux. La méfiance que les chercheurs en littérature ou en sciences humaines et sociales en général peuvent éprouver envers les humanités numériques vient en grande partie du fait que celles-ci les éloignent de leurs méthodes habituelles. Ayant fait des études en littérature, j’essaye dans mes travaux de tenir compte des théories littéraires et de les appliquer le mieux possible pour intéresser aussi les partisans d’une approche plus traditionnelle.

Vous avez remporté le prix Paul Fortier à la conférence DH 2016 qui s’est tenue à Cracovie en juillet. Pourriez-vous revenir sur les conclusions de votre travail et ce qu’il apporte à la critique littéraire ?

Suzanne Mpouli

L’idée était de voir concrètement comment se manifeste le dialogisme qui apparaît dans la critique du XIXe siècle, et la manière dont les critiques empruntent et se réapproprient des concepts scientifiques. Or la comparaison a justement le pouvoir d’introduire des éléments appartenant à des domaines distincts. Nous avons donc extrait automatiquement les comparaisons dont le comparant relevait du discours scientifique, et nous les avons également classé par domaine (zoologie, biologie, médecine, physique, astronomie, etc.) en utilisant un dictionnaire électronique qui spécifie le domaine auquel un mot se rattache.

Marine Riguet

Cela nous a permis, ensuite, de faire une étude statistique des résultats. On en revient toujours à la question de la taille du corpus : sur un corpus aussi vaste que le mien, la méthode automatique développée par Suzanne était plus que précieuse et a rendu possible un travail de détail, qui aurait été irréalisable manuellement.

Suzanne Mpouli

Notre étude nous a amenées à montrer à voir que les critiques ne traitent pas de la même manière les différents domaines scientifiques. La zoologie et la chimie, par exemple, sont beaucoup mieux représentées. Nous avons également mis en valeur ce qui distingue la critique positiviste et la critique symboliste, qui donnent des connotations différentes aux termes scientifiques. Pour la critique symboliste, par exemple les mathématiques sont considérées comme étant assez arides, à l’inverse de l’art.

Marine Riguet

Nous avons aussi pu identifier les concepts scientifiques qui étaient prédominants à l’époque, notamment le concept d’espèce. Mais au-delà de ces préoccupations spécifiques, je trouve qu’il est intéressant de retenir la manière dont nous avons été amenées à croiser nos travaux. En humanités numériques, on est souvent guidé par des hypothèses que l’on cherche ensuite à éprouver par les techniques numériques, soit pour les vérifier soit pour les révoquer. Là, notre démarche a été tout autre. Notre collaboration est née d’une discussion banale où nous échangions Suzanne et moi sur nos sujets respectifs. Nous nous sommes demandé si la méthode de Suzanne pourrait avoir une pertinence par rapport à mes objets d’étude, et nous avons tenté l’expérience. Nous nous sommes en quelque sorte livrées au hasard de la fouille. La recherche en humanités numériques littéraires, c’est aussi accepter de se laisser surprendre...

Quels sont vos projets en cours ou à venir ?

Suzanne Mpouli

Nous sommes en train d’écrire un article issu de notre communication pour un numéro spécial de Digital Scholarship for the Humanities. Nous avons enrichi notre travail en y ajoutant une dimension temporelle, afin de voir à quel moment apparaissent les différents phénomènes que nous avons observés. Nous avons aussi extrait des comparaisons dans d’autres corpus (philosophiques, scientifiques et littéraires) pour montrer que le dialogisme science/littérature est propre aux textes critiques de l’époque. Pour ce qui concerne la méthode d’extraction automatique des comparaisons, j’ai publié un premier article et je prévois d’en publier un deuxième qui exploitera les données issues du projet de crowdsourcing. Je poursuis aussi mes travaux sur les comparaisons figuratives en général, et notamment l’utilisation des noms propres.

Marine Riguet

De mon côté, il faut d’abord que je finisse ma thèse. Je continue aussi de travailler sur Jouve. J’aimerais beaucoup, à l’avenir, réaliser une édition électronique de l’ensemble de son oeuvre. C’est un immense poète qui a écrit ses recueils et ses romans en parallèle, et une édition numérique ferait particulièrement sens, car elle permettrait de circuler dans son œuvre de façon transversale, en rendant visible, si l’on peut dire, son écriture palimpseste. Mais il faut encore attendre que ses textes entrent dans le domaine public...

Propos recueillis le 27 octobre 2016 par Marc Douguet

Image : ©Marc Douguet