PAGE ACCUEIL

Entretien avec Didier Alexandre

18 Mars 2016

Entretien avec Didier Alexandre

 

Didier Alexandre est professeur de littérature française à l’Université Paris-Sorbonne et directeur du labex OBVIL. Il nous explique la philosophie qui a présidé à sa création et présente le bilan de quatre années de recherche en humanités numériques.

Comment définiriez les objectifs de l’OBVIL ?

On peut partir d’un phénomène contemporain : le numérique bouleverse la diffusion des savoirs et des opinions, et même parfois les conditions d’écriture et d’édition. Cela a des conséquences pour nos disciplines, où le livre, l’écrit, le texte, etc. occupent une place centrale. À partir de ce constat, nous nous sommes demandés comment une connaissance de l’informatique et du numérique pourrait être utile à nos études : il s’agit à la fois de repenser ce qu’est un texte, un document, un corpus, et de nous demander quelles sont les limites de cet apport. Notre démarche est à la fois une démarche d’acquisition de nouvelles méthodologies d’édition, d’herméneutique et de critique littéraire, et, en même temps, une pensée méta-critique de leurs limites. En cela, nous restons fidèle à ce qui se fait dans notre équipe, l’UMR CELLF 16-21 : nous adoptons toujours une position de mise à distance vis-à-vis des démarches critiques que nous mettons en œuvre. Outre cet enjeu scientifique et cognitif, il y en a un second, qui est social et culturel, car le numérique est un phénomène massif dans les sociétés contemporaines. Enfin, il y aussi chez beaucoup d’entre nous cette conviction que, puisqu’il y a mutation scientifique et technologique, autant se l’approprier plutôt que d’être absorbés par elle, autant essayer de comprendre et de participer à ce qui se passe que d’en être les victimes.

L’OBVIL met en œuvre une méthodologie qui lui est propre, et que partagent les différents projets qui sont développés en son sein. Quel bilan tirez-vous des activités menées par le labex depuis sa création ?

C’est un bilan très positif. Pour ce qui concerne le bilan scientifique, nous avons dépassé le stade de la simple constitution et numérisation de corpus. Actuellement, pour beaucoup d’enseignants-chercheurs au niveau national et même international, « faire de l’informatique » ou « faire du numérique », comme on dit, c’est avant tout numériser des textes – de manière un peu anarchique, d’ailleurs, sans qu’il y ait d’unité méthodologique, d’unité de langage, etc. Nous, grâce à nos équipes de numérisation, nous avons mis au point des techniques très performantes. Nous avons atteint un seuil d’automatisation important, et le corpus est très conséquent, d’autant plus qu’il va être augmenté de 120000 documents que nous donne la BNF. Il va constituer la première grande bibliothèque électronique en France. Mais nous avons dépassé le stade de la simple numérisation puisque nous développons maintenant, dans chaque projet, différentes voies d’accès vers un text-mining, sans nous enfermer dans des schémas herméneutiques uniques. On peut faire du text-mining, mais aussi de l’alignement de texte, par exemple – dans ce cas on s’oriente davantage vers des interrogations de génétique éditoriale. On construit aussi des thésaurus qui prennent la forme d’ontologies et qui sont des outils puissants d’interrogation de très gros corpus. L’autre grand intérêt positif, c’est que nous avons fait venir à l’intérieur de l’espace scientifique du labex beaucoup de jeunes chercheurs : des contrats doctoraux, des post-doctorants, mais aussi beaucoup de contrats de stagiaires qui s’initient aux méthodologies du numérique. C’est un acquis considérable. Nous enseignons en master pour faire circuler ces méthodologies de numérisation et d’interrogation des textes, et nous organisons aussi un séminaire de recherche annuel. Enfin, nous avons réussi à dépasser l’espace local des littératures – françaises, comparées, italiennes, anglaises, espagnoles – pour nous ouvrir à une réflexion beaucoup plus générale sur les enjeux des humanités numériques, où l’on retrouve cette fonction méta-critique que j’évoquais tout à l’heure, et qui nous permet de penser ce qui est en train de se passer d’un point de vue anthropologique, ethnologique, épistémologique. On ne peut que se féliciter du travail accompli, de l’intérêt que le projet a suscité et de l’accueil des différents chercheurs à l’intérieur de la Sorbonne et de l’UPMC.

Quelle est aujourd’hui la place des humanités numériques dans le paysage universitaire français ?

Elles font l’objet d’un intérêt très fort : la preuve, c’est que, cette année, il y a un poste de professeur publié à Sciences Po, un à Grenoble et un à Rennes 2. Et il y en a évidemment aussi un à la Sorbonne. On assiste à une véritable prise de conscience de l’importance de cette discipline à l’intérieur des corps professoraux universitaires. Mais il reste à savoir ce que sont les humanités numériques. C’est une discipline qui se singularise par sa transversalité et son interdisciplinarité. Il faut se demander quelle est son extension. Ce peut être une extension disciplinaire, et on parlera alors d’humanités numériques littéraires. C’est aussi une discipline beaucoup plus transversale, qui pose des questions quasiment ontologiques pour le chercheur : le chercheur est-il simplement constitué de la personne du chercheur, avec ses facultés intellectuelles, ses pratiques traditionnelles, etc. ou bien est-il transformé par son rapport à l’informatique et au numérique ? En ce sens, les humanités numériques, c’est aussi ce qui touche aux humanismes et à l’humain.

Vous évoquiez l’implication du labex dans la formation. Il est aussi à l’origine de la création d’une nouvelle bi-licence « Lettres et informatique », qui sera proposée à la rentrée prochaine par l’Université Paris-Sorbonne et l’UPMC. Quels seront ses débouchés ?

Cette bi-licence était déjà présente dans le projet initial du labex déposé auprès de l’ANR et du Commissariat général aux investissements, où nous nous étions engagés à créer une licence et un master. Si nous voulons avoir des étudiants qui puissent mener des réflexions influencées par les sciences du numérique et portant sur des objets littéraires, il faut qu’ils aient une formation minimale aux pratiques de codage et de balisage et aux usages qu’on peut en faire. La chance d’avoir une double formation en lettres et en informatique prédispose donc davantage à des carrières dans les humanités numériques. La bi-licence peut orienter vers des masters recherche soit en informatique, soit en littérature, mais elle peut aussi orienter vers des métiers du numérique qui associent l’informatique et la culture au sens large. Cela peut même être des métiers de création : créer un jeu vidéo, par exemple, nécessite des connaissances sur ce qu’est une fiction et un scénario, sur les séquences et les phases d’une action, etc. Cela soulève des questions d’écriture qui sont exactement celles sur lesquelles nous travaillons en littérature. Plutôt que de les laisser à d’autres, pourquoi ne pas nous approprier ces pratiques, les enseigner, et avoir une reconnaissance dans ce domaine ?

Pouvez-vous nous présenter les nouveaux projets auquel travaille actuellement l’OBVIL ?

Nous allons laisser un peu en retrait tout ce qui est numérisation, parce que nous considérons que nous avons acquis un savoir-faire, et nous allons mettre l’accent sur les questions de text-mining et de visualisation. Nous essayons de développer des projets qui pourraient être orientés vers la génération automatique de graphes à partir de la fouille de textes – on sait quelle place occupent actuellement ces outils dans la production scientifique des humanités numériques. Nous sommes également en mesure de produire à travers la numérisation des bases documentaires conséquentes, qui prendront la forme de thésaurus alphabétiques et qui regrouperont virtuellement toute l’information possible sur un sujet ou un écrivain. Actuellement, nous sommes encore centrés sur les textes, mais on pourrait concevoir une base autour d’un auteur, qui réunirait tous les artistes, tous les films, tous les documents iconographiques, tous les enregistrements, toutes le traditions et toutes les allusions qui se rapportent à cet auteur depuis sa mort jusqu’à présent. Ceci a déjà été pratiqué aux États-Unis : le MetaLab d’Harvard, par exemple, a construit une base de ce genre pour un objet limité, le musée d’Harvard. Ce projet-là, nous l’avons pour certains écrivains, comme Apollinaire. Notre orientation est donc de plus en plus tournée vers la production d’objets littéraires numériques plutôt que vers une simple numérisation qui resterait assez proche du livre ou du texte.

Créé il y a quatre ans, le labex est actuellement à mi-parcours. Quelles pourraient être ses perspectives après 2019 ?

Au bout de huit années nous aurons rempli notre contrat, et nous aurons une production scientifique cohérente et considérable. La transversalité du labex peut être une force pour assurer son avenir. La COMUE Sorbonne-Universités voudrait nous accueillir dans deux instituts en particulier, l’Institut de calcul et de simulation et l’Institut du patrimoine. Nous aurons aussi, je pense, des propositions à faire de notre côté auprès des présidents de nos universités, de la future université unique ou de la COMUE pour obtenir les moyens de pérenniser le labex et surtout de pérenniser ses financements.

La force du labex, c’est aussi son ouverture à l’international. Comment travaillez-vous avec vos partenaires internationaux ?

Nous avons eu deux types de relais. Le premier, c’était la Fondation Maison des Sciences de l’Homme, avec laquelle nous avions un programme de post-doctorat, le programme Fernand Braudel. La seconde voie de collaboration se fait ou bien par des contacts personnels, ou bien à travers la Mellon Foundation, dont le siège est à New York. Grâce à la Mellon, nous avons établi des programmes avec l’ARTFL de Chicago University et le Literary Lab de Stanford University. Nous avons aussi de longue date des contacts avec le CNR de Pise, où il y a un centre de recherche en linguistique computationnelle très efficace. Nous essayons actuellement de développer de nouveaux programmes avec la Mellon Foundation, en particulier un programme de collaboration étroite avec Harvard. Les négociations sont en cours, et nous aurons des informations à donner dès l’automne. Ce seront des programmes d’enseignement, de contrats doctoraux communs et de mobilité enseignante et jeunes chercheurs, avec des financements assez conséquents. Nous avons aussi des contacts qui se développent de plus en plus avec des universités de la côte Est, notamment Brown University et Johns Hopkins University. Milad Doueihi, qui occupe la chaire d’humanités numériques de Sorbonne Universités, est un des artisans importants de ces rapprochements. Jean-Gabriel Ganascia joue également un rôle essentiel dans la développement de ces relations et de ces programmes.

Vous-même êtes spécialiste de la littérature française du XXe siècle. Comment les recherches menées au sein de l’OBVIL ont-elles influencé vos propre travaux ?

Elles bouleversent un peu mes approches, à la fois en termes de taille des corpus et pour ce concerne les conclusions que je peux tirer de mes analyses. J’avais déjà travaillé sur des corpus larges, notamment dans le cadre de l’ACI « Histoire littéraire des écrivains » que dirigeait Antoine Compagnon, qui est d’ailleurs, il faut le rappeler, une des origines du labex. Mais au fond je travaillais de manière académique, avec ma manière à moi de prendre mes notes sur des petits bouts de papier, de noter des lambeaux de phrases, de noter simplement des numéros de page sur les couvertures, etc. C’était de l’artisanat. Et je travaillais avec ma propre mémoire. Le numérique, tout d’abord, a changé la taille des corpus. Jusqu’à présent, je pouvais travailler sur un corpus de sept ou huit auteurs différents : là, c’est radicalement différent et bien plus considérable, puisque nous travaillons sur quasiment 1000 ouvrages. La taille des corpus, leur diversité, parfois leur hétérogénéité transforment l’objet de notre recherche et la manière de l’interroger. Avant, on travaillait sur des périodes longues, mais avec des sondages ponctuels. Maintenant, on peut travailler sur une durée beaucoup plus continue. On est aussi confronté à des corpus qui sont beaucoup moins homogènes que quand on travaille sur des corpus construits de manière unitaire. Grâce aux logiciels d’alignement, au logiciel DeSeRT de Jean-Gabriel Ganascia, ou bien à Philologic 4, on voit très bien qu’on a des réponses sur des chaînes lexicales communes. Mais on voit aussi que toute une partie du corpus nous échappe, qu’il y a énormément d’éléments dissonants. Cela nous amène à affiner les réponses, à relativiser, voire à revoir certaines conclusions que nous avions. J’ai travaillé par exemple avec vous récemment sur les quatre versions de La Jeune Fille Violaine et de L’Annonce faite à Marie de Claudel : cela m’a fait revenir sur certaines conclusions que j’avais pu tirer pour l’édition Pléiade. On disait toujours que la première version était injouable, qu’elle n’était pas faite pour la scène, mais on s’aperçoit que c’est au contraire une version qui a énormément de rythme scénique, et qui possède une scénographie complexe. Pour un jeune dramaturge, c’est assez étonnant. Elle est très surchargée en didascalies et tout en mouvement, avec une vraie chorégraphie à l’intérieur. Elle a donc peut-être bien été écrite pour la scène, non pas pour la scène telle qu’on la pense en 1910, mais pour une scène symboliste. Ces nouvelles méthodologies nous poussent donc à revenir sur les jugements parfois un peu hâtif qu’on peut avoir, mais aussi sur notre geste critique et sur les outils que l’on utilise, et à nous interroger sur leur pertinence. Elles nous offrent la possibilité d’avoir une tout autre approche de la littérature.

J’aimerais terminer en saluant le travail difficile qui est fait par nos équipes administratives. Il y a vraiment beaucoup à faire dans un gros labex comme celui-ci : je pense à Oriane Morvan, à vous. Je pense aussi aux ingénieurs, Éric Thiébaud, Frédéric Glorieux et Vincent Jolivet, qui travaillent dans des conditions difficiles, qui sont très sollicités et qui veulent vraiment participer à la recherche qui se fait. Ce qu’on a aussi créé dans le labex, et qui n’existait pas avant, c’est une vraie structure de laboratoire, comme en témoigne le fait que beaucoup d’articles que l’on va publier dans le prochaine numéro de la RHLF Littérature et informatique soient cosignés. C’est vraiment un travail collaboratif, et, à mon avis, c’est aussi un trait positif conséquent.

Propos recueillis le 14 mars 2016 par Marc Douguet.