Le laboratoire IHRIM (CNRS 5317) organise le 1er février 2019 à l'université Jean Monnet de Saint-Étienne la première séance du séminaire
Indexer les corpus numériques.
Université Jean Monnet Saint-Étienne 33 rue du 11 Novembre | Bât. G | Salle G0.5
La constitution d’index est un véritable enjeu scientifique et technique, pour lequel il existe encore peu de documentation. Les index relèvent, avec l’annotation, de l’exploitation scientifique des textes édités : ils sont des outils de navigation dans le corpus et participent à sa compréhension en identifiant les personnes, les lieux et les œuvres mentionnés, ainsi que les matières traitées. L’exploitation de ces données aide par exemple à visualiser des réseaux de relations. Les référentiels et les notices d’autorités permettent d’uniformiser et de consolider les index grâce à l’emploi d’un vocabulaire contrôlé et de formes normalisées. Ils apportent des solutions au traitement des variantes des patronymes, des toponymes et des titres d’ouvrages. Dans la perspective du Linked Open Data, l’alignement sur des référentiels aide à enrichir les données d’un projet en les complétant avec d’autres ressources et bases de données (data.bnf.fr, IdREF, VIAF, ISNI). Le séminaire, fondé sur le partage d’expériences d’ingénieurs et de chercheurs impliqués dans l’édition de corpus numériques, vise à définir les bonnes pratiques utiles à l’établissement d’index, pour identifier et documenter de manière univoque une notion ou une entité nommée.
Le séminaire est ouvert à tous, sur inscription à cette adresse : ihrim-seminaire-index@univ-st-etienne.fr
Programme
09h15 Accueil
10h00 Ouverture
Pratiques des référentiels
Présidence de séance Philippe Colantoni (UJM Saint-Étienne, vice-président délégué au numérique)
10h30 François Mistral | ABES, responsable d’IdRef-Autorités | IdRef : une offre de services à destination de la recherche pour enrichir les données et accroître leur interopérabilité.
11h30 Francesco Beretta | CNRS, LARHRA UMR 5190 | Encodage sémantique de textes historiques et référentiels publics : retours d’expériences et perspectives.
Indexation et corpus numériques
Présidence de séance Thomas LebarBé (Université Grenoble Alpes, coordinateur du Consortium Cahier)
14h00 Emmanuelle Morlock | CNRS, HISOMA UMR 5189 | Indexation et qualification des contenus en TEI : méthodes, outils et exploitations possibles.
15h00 Thierry Joliveau | UJM Saint-Étienne, EVS UMR 5600 | Retrouver, annoter, cartographier et analyser les entités spatiales nommées dans un corpus de romans parisiens.
16h00 Laurent Capelli | CNRS, Huma-Num | Collectes, enrichissements et normalisations sur ISIDORE, la plateforme d’accès aux données numériques des SHS.
Cet événement a reçu le soutien du Consortium Cahier et de la MSH Lyon-Saint-Etienne. Coordination Emmanuelle Perrin (UJM Saint-Étienne, IHRIM) et Fabienne Vial-Bonacci (CNRS, IHRIM).