JE L'étude des textes anciens à l'ère numérique
L'ÉTUDE DES TEXTES ANCIENS À L'ÈRE NUMÉRIQUE ENJEUX CRITIQUES ET MÉTHODES APPLIQUÉES
Évaluer l'apport et les limites des outils numériques pour l'étude critique des textes anciens
PROGRAMME
Mardi 23 juin
09h45 Ouverture de la journée d’étude
Président de session : Hassan Chahdi
10h15 : Aryan Rahimian - Université de Lorraine
Interroger ses sources : le RAG comme outil de recherche pour les textes arabes et persans.
Résumé :
L'architecture RAG (Retrieval-Augmented Generation) constitue aujourd'hui l'une des évolutions les plus significatives pour la recherche documentaire en sciences humaines : en combinant recherche sémantique dans un corpus constitué par le chercheur et génération de réponses en langage naturel, elle permet d'interroger des sources primaires d'une manière qualitativement différente de la recherche plein texte classique. Cette communication propose une exploration critique et appliquée de
ces possibilités pour l'étude des textes arabes et persans, depuis la transcription automatique de manuscrits jusqu'à l'interrogation sémantique de corpus constitués. À partir de démonstrations comparant différents environnements, il s’agira de montrer ce que ces outils permettent et ce qu'ils ne sauraient remplacer : l'interprétation du sens, la mise en contexte historique et la critique philologique.
11h00 : Sophie Robert-Hayek - Sorbonne Université
Aux sources oubliées de la stemmatologie computationnelle : la « méthode par les groupes » face à la phylogénétique
Résumé :
Depuis les années 1990, la stemmatologie computationnelle a largement adopté les méthodes issues de la phylogénétique (parcimonie maximale, méthodes de distance, inférence bayésienne, réseaux de splits…) en empruntant à celle-ci ses modèles, ses outils et ses critères d’évaluation pour reconstruire l’histoire des transmissions manuscrites. Cette importation, désormais largement acceptée au sein de la communauté scientifique, a néanmoins occulté une tradition antérieure de méthodes algorithmiques de construction du stemma codicum, développées spécifiquement pour la transmission textuelle. La méthode dite « par les groupes » de Dom Jacques Froger (1968), prolongeant et dépassant la méthode des « comparaisons par trois » de Dom Henri Quentin (1926), permet d’articuler une approche algorithmique rigoureuse, qui anticipe certaines formalisations cladistiques élaborées indépendamment une vingtaine d’années plus tard, et l’expertise philologique, par son ancrage dans la tradition lachmannienne. Cette communication propose de redécouvrir cette méthode et son auteur, l’un des pionniers de l’application de l’informatique à l’étude des manuscrits, et d’en examiner la pertinence contemporaine au regard des méthodes phylogénétiques aujourd’hui dominantes.
12h00 : pause déjeuner
14h00 : Mouhamadoul Khaly Wélé - CNRS
Apports et limites de la philologie computationnelle pour l'édition critique des premières traductions européennes du Coran : le cas de Coran 12-21
Résumé :
Cette intervention propose un retour d'expérience sur le projet Coran 12-21, plateforme d'édition critique et numérique des traductions européennes du Coran du XIIe au XXIe siècle. À partir de l'encodage XML-TEI de plusieurs traductions et de leur mise en regard synoptique via Versioning Machine, nous examinerons dans quelle mesure les outils de la philologie computationnelle renouvellent l'étude des traductions anciennes du Coran. Loin de se limiter à un bilan technique, l'intervention interrogera également les limites de ces approches : contraintes liées au traitement de l'arabe en environnement multilingue, structures hétérogènes des textes anciens, tensions entre automatisation et exigence philologique, et questions d'interprétation que l'outil numérique ne saurait résoudre seul.
15h00 : Robert Alessi et Jean-Charles Coulon - CNRS
Études arabes sous LaTeX : introduction aux packages ArabLuaTeX et Ekdosis
Résumé :
LaTeX est un langage informatique de balisage dont la finalité est de produire des documents à la mise en page et la qualité typographique optimales. Basé sur TeX créé par Donald Knuth en 1977 afin de pallier les graves incuries de maisons d’édition pour la mise en page d'articles en mathématiques (notamment la composition d’équations mathématiques), LaTeX propose une immense quantité de packages adaptés aux besoins spécifiques de champs scientifiques particuliers. Ainsi, le package ArabLuaTeX permet un traitement de l’arabe d’une qualité bien supérieure aux logiciels de traitement de textes habituels, ainsi que le package Ekdosis conçu pour répondre aux exigences typographiques et de mise-en-page des éditions critiques de textes. Ce dernier permet notamment une production simultanée aux formats pdf pour l’impression et XML-TEI pour l’édition électronique, dépassant largement les limites inhérentes aux logiciels de traitement de texte classiques.
16h00 : Hassan Chahdi - Université de Lorraine
Clôture de la journée d’étude