Le traitement numérique des matériaux galloromans : sources anciennes, nouveaux problèmes
Journée d'étude
Le traitement numérique des matériaux galloromans: sources anciennes, nouveaux problèmes
Organisée par
Mathieu AVANZI & Joanna PAUCHARD
Jeudi 16 février 2023
Espace Tilo-Frey, salle RN02
La journée peut également être suivie en visioconférence, lien ici
Description de la journée
L'étude des parlers galloromans, c'est-à-dire des dialectes issus du latin populaire qui se sont développés dans l'espace francophone de l'Antiquité à nos jours, et dont le français est l'un des représentants les plus emblématiques, repose en général sur l'examen de matériaux anciens: manuscrits, cartes, fiches et carnets d’enquête, etc. A l'ère des humanités numériques, le traitement de ces sources pose d'intéressantes questions, relatives à l'adaptation des méthodes d'analyse existantes pour les langues de grande diffusion d'une part, à la mise au point de nouveaux outils d'analyse d'autre part. Le but de cette journée d'étude est de faire le point sur les réponses que les uns et les autres tentent d'apporter à ces questions, qu'ils travaillent au sein de projets relatifs aux dialectes francoprovençaux ou au français médiéval et classique.
Programme prévisionnel
08.00-08.30 - ACCUEIL DES PARTICIPANTS
09.00-09.45 Lorraine FUHRER (Université de Neuchâtel) "L'analyse graphématique et lexicale de la production documentaire médiévale de la ville de Fribourg (CH)"
Cette communication entend décrire les analyses graphématiques et lexicales d’un corpus textuel fribourgeois réalisées à l'aide de l’outil Phoenix2 développé à Zurich sous la direction de Martin Glessgen dans le cadre de l'édition des Documents linguistiques galloromans.
09.45-10.30 Elisabeth BERCHTOLD (GPSR, Université de Neuchâtel) "Comment interpréter, rendre accessible et mettre en valeur le fonds R.-C. Schüle à l'aide d'outils actuels?"
À partir des années 1940, Rose-Claire Schüle a mené des enquêtes et collecté des matériaux pour un Inventaire lexicologique du parler de Nendaz dont elle a publié les trois premiers volumes en 1963, 1998 et 2006. Les matériaux pour sept autres volumes ont été déposés au Centre de dialectologie après son décès en 2015. Nous présenterons ce fonds et nous interrogerons sur les modalités de publication.
10.30-11.00 - PAUSE CAFE
11.00-11.45 Mathieu AVANZI (Université de Neuchâtel) "L'Atlas Morphosyntaxique des Patois de la Région de Lyon: de la saisie à la cartographie des manuscrits"
À la fin des années 1880, Léon Clédat lance une grande enquête par correspondance en vue de documenter les propriétés morphosyntaxiques des patois de la région de Lyon. Restés inexploités pendant plus d'un siècle, les centaines de manuscrits renvoyés par des instituteurs originaires des 16 départements s'agençant au nord et au sud de l'ancienne capitale du francoprovençal ont été scannés en 2015. Dans cette communication, je présenterai les étapes suivies en vue de leur édition numérique sous la forme d'un atlas.
11.45-12.30 Joanna PAUCHARD (Université de Neuchâtel) "Comprendre les corrections d'un manuscrit francoprovençal moderne grâce aux outils numériques"
Réaliser une édition XML d'un manuscrit ne sert pas uniquement à faciliter le travail de mise en forme de l’édition papier. Elle permet aussi de renseigner de nombreuses informations qui sont à même d'éclairer une analyse linguistique. Dans cette communication, nous aborderons à la fois les enjeux des corrections attestées dans un manuscrit francoprovençal, mais aussi comment les outils numériques tels que Python et XML peuvent nous aider à les exploiter.
12.30-14.00 - REPAS
14.00-14.45 Timothée PREMAT (Univ. Côte d’Azur & Sorbonne Université) "Comparalem: étudier la variation graphique dans des corpus annotés de français médiéval"
Nous proposons de présenter l'outil Comparalem, un ensemble de scripts R que nous avons développés pour l'analyse grapho-phonologique de textes en français médiéval. Ces scripts permettent d'étudier la répartition d’une variable au sein de larges ensembles textuels enrichis comme la BFM (Guillot-Barbance et al., 2017) ou le NCA (Stein et al., 2006).
14.45-15.30 Patric SAUZET (Université de Toulouse) "Les pronoms sujets de l'occitan baroque"
On appelle parfois "occitan baroque" les formes d'occitan des 16e, 17e et 18e siècles, entre les usages médiévaux et l'émergence de pratiques renaissantistes. Une caractéristique saillante des textes baroques est la présence massive de pronoms sujets exprimés, alors que l'occitan plus récent apparaît globalement comme une langue à sujet nul ("pro drop"). Les usages de textes baroques ont souvent été jugés inauthentiques et calqués sur le français. Il y a des raisons de penser qu'il n'en est rien. Des raisons externes et surtout internes que l'on peut tirer d'un examen des textes littéraires imprimés dans la période. Je prendrai l'exemple de textes du Théâtre dit des "Caritats" joué à Béziers au XVIIe siècle. Je m'intéresserai à la fois aux observations syntaxiques que l'on peut y faire et aux problèmes que pose l'édition et la manipulation de textes à la graphie et au découpage morphologique instables.
15.30-16.00 - PAUSE CAFE
16.00-16.45 Myriam BERGERON-MAGUIRE (Université Sorbonne-nouvelle) "Objectifs et méthodes du projet Missing hAlf the picture: ClassIcal NoT sO claSsical FrencH (MACINTOSH)"
Cette intervention consistera à présenter un projet consacré à la constitution et à l'annotation d’un corpus de français des 17e et 18e siècles, confectionné à partir d'une vaste collection de lettres privées, les "Prize Papers". Le projet vise à étudier les témoignages alternatifs de cet ensemble dans l'objectif de combler les lacunes de la linguistique historique traditionnelle appliquée au français de cette période.
16.45-17.30 Claire DE MARESCHAL (Sorbonne Université) "‘Tout n'est pas dans Racine’. Les écrits de peu-lettrés, un nouveau paradigme pour la recherche: l'exemple des Prize Papers"
Cette communication a pour but de mettre en lumière un ensemble de lettres en français échangées entre la France métropolitaine et les Antilles, et faisant partie du corpus londonien des "Prize Papers". L'étude de ce corpus s'inscrit dans un courant relativement novateur de la recherche en linguistique diachronique, celui de l'étude de productions écrites émanant de personnes peu-lettrées.
CLÔTURE DE LA JOURNEE