Les partis-pris scientifiques de l’Atlas linguistique numérique de la Normandie

L’Atlas linguistique numérique de la Normandie est fondé sur les données recueillies par Patrice Brasseur lors de ses enquêtes réalisées entre 1970 et 1976. Aucun résultat n’a été modifié, cela va sans dire, et les doutes sur certaines transcriptions qui peuvent apparaître à la lecture de quelques cartes ont été levés par la consultation des carnets d’enquête conservés aux Archives départementales de la Manche.

L’Atlas linguistique numérique de la Normandie n’est pas une reproduction de l’Atlas linguistique et ethnographique. D’une part, il ne vise pas à restituer l’intégralité des cartes de l’ALN, mais seulement une sélection déterminée à partir de plusieurs critères : l’intérêt scientifique (aspects linguistiques et/ou ethnographiques) et la capacité à mobiliser l’attention de lecteurs de la première moitié du XXIe siècle. D’autre part, il n’est pas une simple version scannée de l’ALN, mais bien une nouvelle interprétation cartographique des données recueillies par Patrice Brasseur.

Nous avons constitué une base de données numérique en relevant de façon systématique, carte par carte, toutes les transcriptions consignées par Patrice Brasseur. Cette base de données a ensuite été exploitée au moyen d’un logiciel appelé code R, développé à l’origine pour des programmes mathématiques. Ce logiciel a permis de générer automatiquement de nouvelles cartes, qui peuvent ensuite être modifiées ou améliorées grâce au logiciel Illustrator. Il était indispensable pour l’équipe en charge du projet de développer un protocole qui soit systématique et automatique, afin de développer rapidement le nombre de cartes produites.

Dans la version de l’ALN, il n’y a pas de couleurs : les aires d’extensions limitées, ou si l’on préfère les aires à dominantes dégagées, celles où il y a une même appellation générique, sont délimitées au moyen de lignes imaginaires appelées isoglosses. Mais la carte est neutre, d’une certaine façon, c’est-à-dire que Patrice Brasseur ne privilégie pas, par exemple, une interprétation lexicale ou une interprétation phonétique. Il laisse ce choix au lecteur. C’était un des principes de tous les atlas linguistiques par régions.

Dans la version que nous nous avons développée, nous ne sommes plus neutres. Nous choisissons l’interprétation à donner à la carte, sans évidemment effacer les données premières : lecture orientée plutôt vers les faits phonétiques, ou bien vers les données lexicales, ou bien vers les aspects syntaxiques… À terme, une autre version de l’atlas sera mise en ligne et les données seront accessibles aux chercheurs. Ils pourront accéder aux data, aux fichiers sources, pour utiliser les données, s’ils le souhaitent, d’une autre façon, dans une perspective de science ouverte.

Le code R permet à partir des données de créer des cartes représentant les zones où sont utilisées toutes les formes du mot selon des diagrammes de Voronoï : c’est en fait un calcul mathématique qui donne l’aire de répartition depuis le point d’enquête. Les couleurs sont déterminées de façon automatique en respectant une gamme chromatique qui permet aux gens atteints de daltonisme de pouvoir lire correctement les cartes. Le défaut de ce protocole est que les nuances de couleurs sont parfois un peu difficiles à percevoir, notamment lorsque les données sont très abondantes et proches. Dans la mesure du possible, nous avons tenté de faciliter la lecture en précisant de nouveau les réalisations orales par des mentions écrites localisées et pas seulement génériques. Il faut préciser que la base de données reprend chaque forme relevée lors des enquêtes, point par point.

Les cartes réalisées à l’aide des diagrammes de Voronoï sont exportées en trois formats : pdf, png et svg, téléchargeables par les lecteurs. Pour chaque mot, il existe trois cartes : la version originale scannée, une version en alphabet phonétique international et une avec le système phonologique. Nous avons considéré que l’alphabet dit des dialectologues, élaboré à partir de celui des romanistes par l’abbé Jean-Pierre Rousselot et adopté par Jules Gilliéron, était trop peu connu pour être facilement lisible et maîtrisé par des non-spécialistes, même avertis, et nous avons établi un tableau de conversion, caractère à caractère, qui permet de donner des transcriptions équivalentes aux originales dans l’alphabet de l’Association phonétique internationale (API), mais aussi dans un système phonologique original, basé sur les graphies du français usuel. Ces principes sont perfectibles, nous en avons bien conscience, mais nous essayons ainsi de démocratiser l’accès à ces données. La perte d’information engendrée par la conversion d’un système à un autre est en partie compensée par l’élargissement du public atteint.