MACINTOSH – ANR-22-CE54-0005-01 – MACINTOSH 2023-2026

Des témoignages alternatifs inédits du français classique, en provenance et à destination des (ex-) colonies françaises (1652-1760)

Le projet MACINTOSH est consacré à la constitution et à l’annotation d’un corpus de français de l’époque classique, à partir du témoignage qu’en donne une vaste collection de lettres privées : les « Prize Papers ». Le fonds d’archives auquel elles appartiennent, bien connu des historiens mais quelque peu délaissé par les linguistes, a connu d’abord une vocation juridique, puisqu’il a servi à un ancien tribunal chargé des affaires relatives à la marine britannique, la High Court of Admiralty. L’une des missions de ce tribunal consistait à légiférer une importante activité économique, la guerre de course. Pratiquée surtout en temps de guerre, la guerre de course représentait l’une des plus grandes menaces pour le commerce atlantique au 17^e siècle : elle consistait à affaiblir l’ennemi en capturant ses navires marchands en vue de les déposséder de leurs marchandises et de revendre aux enchères la cargaison saisie. Les recettes étaient ensuite réparties entre les corsaires et la couronne. La documentation transportée par les navires marchands, qui se chargeaient en même temps d’acheminer le courrier entre les Empires et leurs colonies, était aussi saisie puisqu’elle était requise comme pièce à conviction par le tribunal.

D’après une équipe d’historiens de l’Université Carl von Ossietzky d’Oldembourg qui s’occupe de cataloguer le fonds, les « Prize papers » contiendraient environ 160 000 lettres rédigées entre 1652 et 1815.

Les courriers ont été interceptés par la marine britannique sur plus de 30 000 navires qui effectuaient la traversée de l’Atlantique dans un sens ou dans l’autre ; y sont donc incluses des lettres ayant été rédigées dans les colonies qui venaient d’être fondées en Amérique du Nord et aux Antilles, dont les destinataires étaient le plus souvent des proches demeurant dans une ville portuaire en France. D’autres lettres ont été envoyées depuis l’un de ces ports vers le Canada, la Louisiane ou les Antilles. Le projet vise à étudier les témoignages alternatifs de cet ensemble dans l’objectif de combler les lacunes de la linguistique historique traditionnelle appliquée au français classique, tout en permettant de mettre en lumière les dynamiques et les mécanismes qui sont à l’origine des variétés de français et de créole en Amérique.

D’ici 2026, il est prévu de procéder à une sélection rigoureuse de 1 000 lettres, d’en fournir une transcription diplomatique et de baliser ce nouvel ensemble au moyen d’annotations linguistiques.

L’objectif est d’obtenir une édition numérisée polyvalente ainsi qu’une interface permettant d’interroger le corpus. Le programme se divise en quatre étapes : (1) construction du corpus, (2) édition numérique, (3) annotation linguistique (lemmatisation et étiquetage des données), (4) publication en ligne. Les questions de recherche et la méthodologie choisies sont celles de la sociolinguistique, de la linguistique historique et de la philologie romane (numérique) : chaque lettre fera l’objet d’une fiche signalétique renseignant sur l’expéditeur et le récipiendaire de la lettre (sexe, statut social), liens entre les deux, type de lettre (privée ou d’affaires), date, etc. La dimension relative au niveau de littératie et au genre sera prise en compte dans la sélection de l’échantillon, conduisant à une représentation équilibrée du français pratiqué par les femmes et les hommes des plus lettrés aux moins lettrés, ce qui n’est guère le cas dans les sources existantes pour l’époque concernée. À terme, le corpus annoté sera mis à disposition en ligne en libre accès et sera équipé d’un module de recherche permettant de l’interroger. Il fera pendant au corpus littéraire qu’est Frantext, lequel véhicule un modèle relativement traditionnel du français. Avec ces deux bases de données textuelles complémentaires, la communauté scientifique disposera d’une façon d’atteindre le français tel qu’il s’écrivait dans tous les milieux, même les moins éduqués.

Les premiers résultats seront présentés dès 2023 et le corpus, dès sa mise en ligne, sera référencé sur le tout nouveau Fonds de données linguistiques du Québec développé au CRIFUQ à l’Université de Sherbrooke.