Modélisation des signes graphiques (1)

À la fin de l’année dernière, Peter Stokes a publié une modélisation UML de l’écriture (« Describing Handwriting, part IV : Recapitulation and Formal Model » dans le cadre de sa série « Describing Handwriting [1] [2] [3] [4] [5] » sur le blog du projet Digital Resource for Palaeography. Ces articles étant publiés avec adresse au lecteur et demandes de commentaires, je lui offre ici ma contribution.

Modèle conceptuel de l’écriture, par P. Stokes

Résumé du modèle d’information

La modélisation présentée est héritière de la base paléographique du MANCASS C11 Database Project, d’une formalisation plus avancée dans les études anglo-saxonnes que dans la paléographie française, et des travaux déjà menés sur l’écriture anglo-saxonne par P. Stokes lui-même, en particulier sa thèse de doctorat English Vernacular Script, ca 990 – ca 1035 (Cambridge, 2006) qui l’a mené à structurer fortement la description de l’information paléographique. Elle va cependant plus loin, en cherchant à déterminer à quel niveau les distinctions doivent être faites, et, au passage, P. Stokes précise certains points de vocabulaire, aussi pour la description des parties composantes des signes graphiques (notamment avec son glossaire), allant dans le même sens que le Vocabularium parvum scripturae latinae dirigé par Juraj Šedivý et Hana Pátková)

Son modèle cherche en outre à concilier deux approches : morphologique, d’une part, et stylistique, d’autre part, c’est-à-dire, du point de vue concret, à permettre, d’une part, l’analyse lettre à lettre, mais aussi, d’autre part, à spécifier des caractéristiques communes. Si l’on transpose dans la typologie de Lieftinck-Gumbert-Derolez, permettre de décrire la forme de la lettre a, mais aussi décrire le traitement des hastes (bouclées ou non) qui vaut, normalement à l’identique pour les lettres b, h, l, k.

Le modèle prévoit, du côté des signes graphiques, l’idée d’un

  • alphabet, composé d’un ensemble de 
  • signes : d’abord dénommés « graphems » par P. Stokes, qui a ensuite spécialisé cette dénomination en « graphems » et « characters », ce dont le modèle conceptuel garde la trace ; Paul Caton a proposé « ontograph » dans un commentaire [ici]. Conscient que le mot « signe » est polysémique, je le choisis pour sa richesse et parce qu’il me semble que, dans le modèle. En tout cas, il faut éviter ici le terme « graphem », trop ambigu, puisque sa première définition correspond à la nôtre, mais est minée par les autres sens possibles, notamment par le sens que lui a donné le projet ANR Graphem, qui est la décomposition graphique signifiante minimale. S’il s’agit d’une valeur sémantique et qui puisse distinguer des prédicats de valeur distincte comme dans bis et lis, c’est au niveau du signe et de la désignation que nous nous situons. Ce qui nous permet opportunément d’intégrer les signes des pauses, comme faisant partie de l’alphabet des signes. Le glossaire de l’Unicode donne :
      •  « Character : (1) The smallest component of written language that has semantic value; refers to the abstract meaning and/or shape, rather than a specific shape ».
      • « Grapheme. (1) A minimally distinctive unit of writing in the context of a particular writing system. For example, ‹b› and ‹d› are distinct graphemes in English writing systems because there exist distinct words like big and dig. Conversely, a lowercase italiform letter a and a lowercase Roman letter a are not distinct graphemes because no word is distinguished on the basis of these two different forms. (2) What a user thinks of as a character » (Glossary of Unicode Terms).
  • caractères : au sens (3) de l’Unicode, ce qui permet de distinguer entre A majuscule et a minuscule.
  • allographes : chaque caractère peut se manifester sous différentes graphies canoniques et également valables dans le système graphique. Par exemple, pour la lettre a, P. Stokes propose « a: Insular, Caroline, cc »
  • idiographes : l’image mentale de chaque allographe que peut concevoir un scribe
  • graphies : chacune des matérialisation du signe (je préfère éviter « graph » qui posera inévitablement des problèmes dans nos constructions d’ontologies.

L’analogie entre ce modèle et les FRBR, pour les entités du groupe 1, a été soulignée par P. Stokes lui-même, et l’on voit bien les mécanismes d’expression, de manifestation et d’instanciation, avec quelques étages supplémentaires qui permettent de séparer le collectif-social de l’individuel-personnel.

<!– @figoblog: qui aurait pensé que mon groupe de modélisation des ressources continues et électroniques à la BnF me servirait autant, quand j’en suis parti ? –>

Le modèle est complété par les agents et leurs particularités :

  • Scribe ou Personne ;
  • Pratique d’écriture ou Main.

Pour relier le tout à un univers codicologique plus riche, les graphies sont reliées à leur support matériel (page < msPart < Manuscript, dans un vocabulaire TEI).

« L’écriture », enfin, est définie comme un ensemble d’allographes.

Pour combiner les aspects morphologiques et les aspects stylistiques, le modèle comprend, en outre, des « caractères généraux » et des « composants » ; ces derniers ont aussi des « caractéristiques de composants ».

Remarques terminologiques

Deux remarques terminologiques doivent être ici faites, en préliminaire.

D’une part, les connexions avec le Vocabularium parvum, et aussi avec les vocabulaires développés dans le domaine épigraphiquedoivent être renforcées, en même temps que seront, peu à peu, intégrées les constructions théoriques des paléographes.

D’autre part, il me semble, à ce stade, et malgré l’objet bien délimité du projet DigiPal, dangereux de nommer certains allographes d’après le nom d’écritures canonisées tels « insulaire » ou « caroline ». Bien évidemment, l’on peut s’entendre sur les termes et les historiens de l’écriture comprendront ce dont il s’agit, comme avec « d oncial ». Deux inconvénients subsistent néanmoins : l’un, déjà soulevé par J. Mallon, est que des formes seront ainsi nommées y compris pour des écritures antérieures ou des écritures qui ont généré les mêmes évolutions ; l’autre est que des écritures avec un certain nom (e.g. insulaire) auront des allographes appelées d’après le nom d’autres écritures (e.g. caroline), de sorte qu’au final, si le modèle doit être extensible, nous risquons une cacophonie terminologique.

L’approche dynamique : réintégrer le ductus

Sur la structure du modèle, voici une première proposition. L’absence de ce David Ganz appelle « approche analytique » dans un commentaire [ici] pose un problème non négligeable, au moins du point de vue théorique pour la tradition paléographique française.

L’ensemble des signes graphiques est décrit d’un point de vue strictement morphologique, qui omet de tenir compte du mouvement qui préside à l’existence de la trace. Pour combler cette lacune, on peut procéder de deux façons :

  • (a) Ajouter dans la définition des allographes que le ductus participe à leur définition, de sorte que le l bouclé tracé en un seul trait (dans un sens anti-horaire en remontant à droite par la boucle et en descendant à gauche sur la haste) soit considéré comme un allographe du l bouclé de la cursiva formata (tracé avec lever de plume, en deux traits posés de haut en bas) ;
  • (b) Ajouter un module au modèle pour tenir compte du ductus dans la description des formes, sachant que celui-ci ne doit pas – du moins la plupart du temps – être considéré comme une idiographie, mais bien comme une façon différente d’envisager le signe graphique dans la suite alphabétique et textuelle.

En lien avec le ductus doit aussi se concevoir une façon de traiter les ligatures, que l’on ne peut décrire ni dans les general features, ni, à proprement parler, dans les allographes. Sur ce point, il s’agit surtout de voir leur organisation et leurs règles d’emploi.

Les règles de l’écriture

Une autre lacune, d’importance, est l’absence de modélisation de l’écriture comme comportement. C’est d’ailleurs ce qui, à mon avis, rend les relations multiples entre les entités scribe, main et écriture d’un côté et composant, de l’autre, aussi multiples, complexes et floues.

Dans les caractères généraux, il me semble que deux aspects « stylistiques » sont mélangés qui devraient être séparés : la possibilité de décrire un même traitement morphologique de plusieurs lettres (hastes bouclées, hampe courbée vers la gauche, etc.) et des caractéristiques graphiques telle que l’angulosité, qui, dans l’état actuel de la classification paléographique ne définit pas des écritures différentes (la question n’est cependant pas close).

Le modèle idiographe < allographe < caractère < signe < alphabet me semble clair, mais la comparaison avec FRBR ne doit pas tromper. Il y a une langue et des mots, des suites imposées de caractères, voire des suites d’allographes qui s’imposent dans des écritures. La possibilité créatrice est certes grande, surtout si l’on compare à la réalité graphique qu’est devenue l’écriture dans son existence imprimée, mais reste limitée socialement. Des contraintes sont imposées à l’écriture par ses formes et fonctions : fidélité, lisibilité,  pérennité — contraintes dont l’on ne peut s’astreindre que dans les alphabets imaginaires, au prix de la perte de la fonction de communication interpersonnelle (fidélité au message et lisibilité), cf. J.-M. Chatelain, « Raisons d’écrire : pour une pragmatique historique de l’écrit », dans C. Jacob (dir.), Lieux de savoir. 2. Les mains de l’intellect, Paris, A. Michel, 2011, p. 377-383, à la p. 378.

Aussi est-il absolument nécessaire d’affiner le rapport entre « écriture » et « allographe ». Une écriture n’est pas simplement un ensemble d’allographes, contrairement à ce que dit P. Stokes, dans un résumé trop rapide (« a set of ALLOGRAPHS makes up a SCRIPT »), alors qu’il évoque lui-même la forme capitale de N dans sa description de la minuscule insulaire anglaise. L’écriture est aussi un ensemble de règles, qui se situent, pour certaines, au niveau collectif (écriture) et, d’autres seulement, non au niveau individuel (personne / main). Je propose de formuler « a set of ALLOGRAPHS and a set of RULES make up a SCRIPT ». C’est à ces règles et à leurs divers niveaux que se consacrent les études de la pragmatique de l’écrit.

Il sera aussi nécessaire, à un moment de la modélisation, de définir la différence entre deux écritures. En effet, si une écriture est un ensemble d’allographes, et sans même mentionner l’ensemble des règles, alors il faut considérer que, dans la littera textualis libraria, le textus rotundus et le textus quadratus selon les définitions de W. Oeser et avec différents allographes de la lettre a, sont des écritures différentes. Je n’y suis pas opposé, mais il faudra réfléchir aux catégories et classes, et aux critères de regroupement au cours de la modélisation.

Cela posera aussi la question de l’intentionnalité de la variation graphique, soit à l’intérieur d’un allographe, soit entre plusieurs allographes, et nécessitera d’approfondir aussi les différences entre allographes et idiographes

La modélisation de l’écriture et ses conséquences sur le travail historique

Un prochain billet traitera plus largement des règles des écritures, de la variabilité et des définitions des écritures. Pour l’heure, je désire remercier très vivement P. Stokes de l’élan qu’il a donné à nos efforts de création d’une ontologie des signes graphiques.

Sa modélisation ouvre déjà la porte à un dialogue renouvelé avec les historiens, pour définir quelles conclusions peuvent être tirées des éléments constatés et observations faites. De nombreux travaux historiques tirent, en effet, des conclusions fausses d’observations justes, comme l’a brillamment démontré M. Aussems par sa communication au CIPL de Ljubljana.

Si la modélisation est bien faite et que le modèle est peuplé proprement par les paléographes, les historiens pourront mieux travailler. Il y a des écritures où la variation est de mise, et où c’est la stabilité qui permet de déceler l’identité de mains, et des lieux et moments où la stabilité des écritures inverse le processus de démonstration (chancellerie royale française ou chancellerie pontificale, selon les époques). En tout cas, seule une observation complète et méthodique de l’ensemble des signes graphiques, des règles d’emplois des différents allographes, et une comparaison avec la norme du temps et du lieux ouvre la voie à un raisonnement historique fondé.

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s