Première partie du cours : typologie des langues

4.2. La typologie morphologique

Les deux dimensions classificatoires que je présenterai dans cette partie sont 1) le degré de synthèse et 2) le type morphologique. L’une et l’autre classification reposent sur la nature de la relation entre les mots et les morphèmes. Le degré de synthèse s’applique au mot et prend en compte la quantité d’information qu’il contient en termes de morphèmes, tandis que le type morphologique procède de manière inverse en prenant appui sur le morphème et en classant les langues en fonction du mode de réalisation des morphèmes dans le mot. Ces deux approches complémentaires peuvent être schématisées ainsi :

degré de synthèse type morphologique
mot Flèche vers la droite morphème
mot Flèche vers la gauche morphème

Les deux notions utiles à cette typologie sont le mot et le morphème. Quelques remarques d’ordre général à ce propos. Le mot existe dans toutes les langues, mais ce à quoi il correspond varie beaucoup d’une langue à l’autre. Une définition générale est donc difficile à mettre en œuvre. La meilleure définition du mot est celle de Mel’čuk [1993]. On en fera l’économie ici car elle repose sur plusieurs notions qui demanderaient un développement qui dépasse le cadre de ce cours. On admettra donc ici la réalité du mot dans les langues. Le morphème, quant à lui, procède de l’analyse – ce n’est pas une donnée immédiate des langues – et fait l’objet d’une définition universelle (le morphème est la plus petite unité de signification). Étant donné la variabilité du mot dans les langues, on comprend par conséquent la pertinence d’une typologie. Toutes les langues n’articulent pas de la même manière les mots et les morphèmes.

4.2.1. Le degré de synthèse

Une comparaison entre deux énoncés équivalents en finnois et en français permettra de comprendre ce qui est en jeu avec le degré de synthèse. Soit les deux énoncés suivants :

finnois français
taskuissani dans mes poches

Ces deux énoncés sont rigoureusement équivalents ; ils contiennent la même information, à la fois sur le plan quantitatif et sur le plan qualitatif. Et pourtant ils n’ont pas la même forme ; un mot en finnois et trois mots en français. Procédons maintenant à l’analyse morphologique de l’exemple finnois :

finnois
taskuissani = tasku+i+ssa+ni = “poche”+PL+INESSIF+1SG
PL = pluriel
INESSIF = “dans”
SG = première personne du singulier

Autrement dit, les “ingrédients” de cet énoncé sont 1) la signification du lexème poche, 2) une signification de pluralité exprimée par le nombre, 3) une signification correspondant à une localisation et 4) une indication de personne. Il n’y a pas lieu de recourir à une quelconque signification correspondant à la possession, car cette notion n’est rien d’autre que l’interprétation résultant de la mise en relation d’un objet (poche) et d’une personne (1SG). On dira par conséquent que le mot finnois contient quatre segments et chaque segment représente un morphème.

Les quatre informations contenues dans l’énoncé finnois se retrouvent évidemment en français puisque les deux énoncés ont la même signification globale. Il y a donc les mêmes morphèmes, mais répartis autrement. Le morphème lexical forme un mot avec le morphème de nombre (poches), le morphème de personne est un mot indépendant (mes) et le morphème correspond à l’expression d’une localisation est représenté en français par une préposition (dans).

Remarquons, que le nombre en français se manifeste deux fois dans l’énoncé. Du point de vue du contenu (ce que l’on cherche à exprimer) il n’est pertinent qu’une seule fois, mais sa présence dans le déterminant possessif est le produit d’une relation de dépendance syntaxique entre le nom et le déterminant. De même, on ne compte pas ici le genre dans les morphèmes exprimant un contenu, car le genre grammatical n’est pas une catégorie qui fait l’objet d’un choix de la part du locuteur. Le genre est simplement une manifestation d’une relation de dépendance entre constituants syntaxiques ; les locuteurs ne cherchent pas à exprimer une quelconque notion (liée notamment à la distinction de sexe) en procédant à un accord en genre.

Résumons : à un même contenu, exprimé en termes de morphèmes, correspond plusieurs réalisations dans les langues. Avec le degré de synthèse, les langues sont classées selon le contenu morphologique des mots. Il s’agit à la fois d’une évaluation quantitative (un ou plusieurs morphèmes dans le mot) et qualitative (nombre de lexèmes dans le mot).

Le degré de synthèse comporte trois types :

  • le type analytique
  • le type synthétique
  • le type polysynthétique

4.2.1.1. Type analytique

Dans les langues analytiques, les mots ne contiennent qu’un seul morphème et sont par conséquent invariables. Les mots complexes ne peuvent être formés que par composition (mise en relation de deux mots). Nombreuses langues d’Asie sont de ce type. Exemples vietnamiens :

vietnamien
Tôi cho anh
moi donner toi
Je te donne
Anh cho tôi
toi donner moi
Tu me donnes
Họ cho tôi sách
il donner moi livre
Il me donne un livre
làng tôi
village moi
mon village

Comme le montrent ces quatre exemples la forme du pronom personnel de première personne est invariable ; sa forme ne dépend pas de sa fonction dans la phrase. La place des constituants est le seul procédé d’identification des fonctions syntaxiques. Le verbe est également invariable ; l’indication de temps du procès décrit par le verbe est donné éventuellement par des morphèmes indépendants comme demain hier maintenant

Puisque les mots ne contiennent qu’un seul morphème, il ne peut y avoir ni flexion (variation en temps, personne, nombre, genre…) ni dérivation (formation de mots au moyen d’affixes). Les mots complexes sont donc formés exclusivement par composition. Quelques exemples :

vietnamien
thợ cày = laboureur (thợ = homme, cày = labourer)
khai trưòng = rentrée scolaire (khai = ouvrir, trưòng = école)
làm việc = travailler (làm = faire, việc = travail)

4.2.1.2. Type synthétique

Dans les langues synthétiques, les mots contiennent plusieurs morphèmes mais un seul lexème. Outre le lexème, les autres morphèmes sont des affixes ou des traits morphologiques. Dans ce dernier cas, le morphème – unité minimale de signification n’est pas associé à un segment. L’exemple finnois précédent (taskuissani = dans mes poches) est un exemple typique de mot synthétique. Autres exemples :

japonais
urite = vendeur
ur+(i)te
vendre+suffixe agentif
tabesaserareru = a été fait mangé
tabe+sase+rare+ru
manger+CAUSATIF+PASSIF+PRÉSENT
turc
gölgeli = ombragé
gölge+li
ombre+suffixe adjectival
evlerimde = dans mes maisons
ev+ler+(i)m+de
maison+PLURIEL+1SG+LOCATTF
quechua
wañuna = mort
wañu+na
mourir+suffixe nominal
yanapawashkanki = (tu) m’as aidé
yanapa+wa+shka+nki
aider+1SG+PASSÉ+2SG

Dans tous ces exemples, les morphèmes sont réalisés sous la forme de segments et les affixes sont soit des préfixes soit des suffixes (selon la place qu’ils occupent par rapport au radical (lexème)).

Un mot synthétique peut aussi contenir des morphèmes non segmentaux. Les morphèmes (ou traits morphologiques) sont révélés alors par l’analyse.

Le mot ma du français contient trois morphèmes : la personne (1SG), le nombre (SG), et le genre (féminin). Chacun de ces morphèmes est mis en évidence par les oppositions avec : ta (2SG), mes (PL), et mon (masculin). Les amalgames du français sont aussi des formes synthétiques puisqu’ils contiennent en un mot exactement les mêmes morphèmes que leur équivalent non amalgamé : du (= de le) vs de la, au (= à le) vs à la
La prosodie peut également être utilisée dans une forme synthétique :

éwé
vǎ = viens !
và + ́
venir+IMPÉRATIF

En ajoutant une modulation montante au ton haut de la voyelle du radical verbal on obtient la forme impérative.

4.2.1.3. Type polysynthétique

Dans les langues polysynthétiques, un mot peut contenir plusieurs morphèmes et aussi plusieurs lexèmes, si bien que le mot peut parfois être assimilé à une phrase complète comme l’exemple suivant emprunté à Hjemslev [1966] :

groenlandais
kavfiliorniarumagaluarpunga = je voudrais faire du café

Malheureusement, l’auteur ne donne pas l’analyse morphologique de cet exemple. On peut cependant supposer la présence de trois lexèmes vouloir, faire et café.

Autre exemple en yupik, autre langue de la famille esquimau-aléoute :

yupik
tuntussuqatarniksaitengqiggtuq =
Il n’a pas encore dit de nouveau qu’il allait chasser le renne

tuntu+ssur+qatar+ni+ksaite+ngqiggte+uq
renne+chasser+FUTUR+dire+NEG+de nouveau+3SG/IND
(NEGation, INDicatif)

Exemple plus simple en nahuatl, langue amérindienne :

nahuatl
ooninakakwah = j’ai mangé de la viande
oo+ni+naka+kwa+h
PASSÉ+1SG+viande+manger+ACCOMPLI

Ce mot contient deux lexèmes (viande et manger) et trois morphèmes grammaticaux (personne, temps et aspect).

Quel est le statut du français au regard de cette typologie ? Sans aucun doute, le français est une langue synthétique comme le montrent les deux exemples suivants représentatifs d’une partie de la flexion des verbes et de la dérivation nominale :

français
chantions
chant+i+ons
chanter+IMPARFAIT+1PL
dénationalisation
dé+nation+al+is+ation
préfixe+nation+suffixe adjectival+suffixe verbal+suffixe nominal

Ces deux mots contiennent un lexème (respectivement chant- et nation) et plusieurs morphèmes flexionnels ou dérivationnels.

Notons que la distinction entre type analytique et type synthétique donne lieu parfois à une opposition en français. On oppose ainsi un futur synthétique (un seul mot pour chantera) et un futur analytique (deux mots pour va chanter). Par ailleurs, on oppose également la forme synthétique – quelque peu obsolète – doctoresse et la forme équivalente analytique femme médecin. De même en anglais, on a une forme synthétique du comparatif (bigger) et une forme analytique (more expansive). De même, dans plusieurs langues, on distingue une conjugaison synthétique où les morphèmes de temps, et de personne, forment un seul mot avec le radical verbal, et une conjugaison analytique où ces mêmes morphèmes fonctionnels sont répartis entre un auxiliaire et le radical verbal (cette distinction est présente notamment en basque et en gallois).

4.2.2. Types morphologiques

Les langues se répartissent en quatre types :

  • type isolant
  • type agglutinant
  • type fusionnant
  • type incorporant

4.2.2.1. Type isolant

Dans les langues isolantes qui sont également des langues analytiques, le morphème se réalise sous la forme d’un mot invariable. À chaque morphème correspond un mot. Dans les exemples chinois et vietnamiens suivants, tous les mots sont invariables (pas d’accord en nombre) et le nombre est indiqué par un mot indépendant (numéral ou indicateur de pluriel) :

chinois
zhei san ben shu = ces trois livres
DEM trois CLASS livre
vietnamien
những chiếc bàn ấy = ces tables-là
PL CLASS table DEM
(DEMonstratif, CLASSificateur, Pluriel)

4.2.2.2. Type agglutinant

Dans les langues agglutinantes, les morphèmes sont réalisés sous la forme de segments. Les morphèmes flexionnels et dérivationnels sont attachés à un radical lexical par préfixation ou suffixation. Les langues agglutinantes sont donc nécessairement de type synthétique. Les morphèmes sont facilement identifiables dans le mot en raison du procédé d’agglutination qui consiste à ajouter les segments correspondant aux morphèmes les uns à côté des autres. Mis à part les cas d’allomorphie, dus le plus souvent à des contraintes phonologiques propre à chaque langue, les segments sont invariables. Le type agglutinant se caractérise donc par le procédé de concaténation des morphèmes dans le mot (A + B + C + D + …), les altérations de la forme des morphèmes intervenant à la jonction des segments étant de nature secondaire. Turc et finnois sont deux langues représentatives de ce type :

turc
evlerimde = dans mes maisons
ev+ler+(i)m+de
maison+PLURIEL+1SG+LOCATIF
finnois
taloissammekin = dans nos maisons aussi
talo+i+ssa+mm+kin
maison+PL+INESSIF+1PL+aussi
(DEMonstratif, CLASSificateur, Pluriel)
näkymättömyydessänsä = dans son invisibilité
näky+mä+ttöm+yyde+ssä+nsä
être visible suffixe nominal+suffixe adjectival+suffixe verbal+INESSIF+3SG/PL
3SG/PL troisième personne du singulier ou du pluriel

Dans l’exemple turc, le suffixe de personne -(i)m admet deux formes (-m et -im) selon qu’il est attaché à un mot se terminant par une consonne (-im) ou à un mot se terminant par une voyelle (-m). Les suffixes de pluriel et de locatif ont deux formes (respectivement -ler/-lar, -de/-da). Le choix entre les deux variantes est gouverné par un processus d’harmonie vocalique qui aligne la voyelle suffixale sur les voyelles du radical en reprenant une des propriétés phonologiques partagées par les voyelles du radical. Il s’agit là rien de moins qu’un processus d’accord interne au mot.

Dans l’exemple finnois, le suffixe d’inessif (= dans) a deux formes (-ssa et -ssä) dont le choix est également gouverné par un processus d’harmonie vocalique comparable à celui du turc.

4.2.2.3. Type fusionnant

Les langues fusionnantes sont appelées aussi parfois langues flexionnelles. On préférera ici le terme fusionnant en raison de sa similitude avec les autres mots qui désignent le type morphologique. Dans les langues fusionnantes, qui sont également nécessairement des langues synthétiques, les différents morphèmes du mot peuvent être réalisés sous la forme d’un seul segment. Il est donc impossible dans ce cas de segmenter le mot en parties plus petites, de telle sorte que chaque morphème soit associé à un segment comme dans les langues agglutinantes. Lorsque la fusion est complète, les morphèmes sont identifiables seulement par l’analyse à partir du paradigme des mots de la même catégorie. Dans l’exemple des articles définis de l’espagnol {el, la, los, las}, chaque mot représente un seul segment correspondant à chaque fois à une collection de trois morphèmes :

espagnol
el = [défini, masculin, singulier]
la = [défini, féminin, singulier]
los = [défini, masculin, pluriel]
las = [défini, féminin, pluriel]

La même chose pour les articles définis du français {le, la, les}, à la différence près que le paradigme à trois termes renvoie à une neutralisation (non distinction) de l’opposition de genre au pluriel. On analysera de la même manière, tout un ensemble de mots en français : les pronoms personnels, les articles indéfinis, les déterminants possessifs, le système des démonstratifs …

La fusion concerne les mots grammaticaux mais aussi les radicaux augmentés d’un ou plusieurs morphèmes flexionnels. En anglais la forme de mot went doit être analysée comme la fusion du radical verbal de go et du morphème de prétérit (went = √go + prétérit). Cet exemple est à comparer avec la forme régulière qui s’analyse comme la concaténation d’un radical et d’un suffixe (arrived = arrive + ed = arrive + prétérit). Went relève donc de la fusion des morphèmes alors que arrived relève de l’agglutination des morphèmes.

Nombreuses sont les langues où la fusion des morphèmes ne concerne que la terminaison du mot, le radical (le lexème) étant alors un segment plus ou moins autonome (la segmentation est alors plus ou moins arbitraire). Quatre exemples typiques :

latin
dominus = maître
domin+us (-us = nominatif, masculin, singulier)
polonais
studenta
student+a (-a = nominatif, animé, masculin, singulier)
albanais
shëpia = la maison
shëpi+a (-a=défini, nominatif, masculin, singulier)
français
vendeuse
vend+euse (-euse = agent, féminin)

On désigne parfois ce type de langues, langues à flexion externe (par opposition aux langues à flexion interne dans lesquelles le radical fusionne avec ses morphèmes fonctionnels)

4.2.2.4. Type incorporant

Les langues incorporantes sont des langues pour lesquelles on peut dire de manière approximative qu’il est possible de rencontrer des “mots à l’intérieur de mots”. Ces langues, nécessairement de type polysynthétique, ont la particularité de pouvoir intégrer des lexèmes dans le mot. Il s’agit donc bien de lexèmes dans un mot et non pas d’un mot dans un autre mot. Ce point sera plus clair lorsque nous aurons examiné un exemple d’une langue incorporante. Mais avant cela, un détour permettra de comprendre ce qu’est une incorporation à partir des quelques rares exemples du français qui se situent exclusivement sur le plan de la formation historique des mots. Les mots suivants ont été formés par incorporation : saupoudrer, colporter, lieutenant, incorporation de l’objet (ou d’un complément) au verbe :

saupoudrer flèche vers la gauche poudrer de sel
colporter flèche vers la gauche porter au cou
lieutenant flèche vers la gauche qui tient lieu de

Il s’agit d’une formation historique ; la signification de saupoudrer n’a plus rien à voir avec le sel. Seul ici lieutenant garde une certaine transparence. Le français n’est pas une langue incorporante, car l’incorporation n’est pas dans cette langue un des procédés productifs pour former des mots complexes ; on utilise plutôt la dérivation (vendeur…), la composition (homme-sandwich…) et la création de mots valise (informatique = information automatique). Dans les langues incorporantes, l’incorporation est un procédé banal utilisé aussi bien pour la formation de mots dans le lexique que pour la construction d’unités syntaxiques. L’exemple le plus connu de construction syntaxique par incorporation est l’incorporation de l’objet indéfini ou générique au verbe. Lorsqu’un objet est défini ou spécifique, il est réalisé sous la forme d’un constituant indépendant ayant la fonction d’objet. Lorsqu’il est indéfini ou générique, il est incorporé au verbe. Ce dernier appartient alors à une construction intransitive. Lorsqu’il y a incorporation, le lexème incorporé perd toutes les caractéristiques nominales qui en font un mot indépendant (pas de nombre, pas d’article, pas de cas). Il s’agit donc bien d’un lexème nu et non pas d’un mot ; c’est pourquoi l’incorporation ne peut pas être définie simplement comme la présence de mots à l’intérieur d’autres mots. Exemples onondaga, langue iroquoise du Canada :

onondaga
Pet waʔhahtuʔtaʔ neʔ ohwista
Pat waʔ+ha+htu+ʔt+aʔ neʔ o+hwist+a
Pat PASSÉ+3M/S+3N+perdre+CAUSATIF+ASPECT ART PRE+argent+SUF
Pat a perdu l’argent
Pet waʔhahwistahtuʔtaʔ
Pat waʔ+ha+hwist+ahtu+ʔt+aʔ
Pat PASSÉ+3M/S+argent+perdre+CAUSATIF+ASPECT
Pat a perdu de l’argent
3M/S = troisième personne du masculin/Sujet
3N = troisième personne du neutre
ARTicle, PREfixe, SUFfixe

Dans le premier exemple, l’objet est défini et se présente comme un constituant phrastique indépendant ; il est précédé d’un article et contient un préfixe et un suffixe nominal. Dans le second exemple, le lexème argent se présente nu, et est incorporé au verbe pour former un verbe intransitif ayant pour signification perdre de l’argent. On remarquera par ailleurs que le verbe du premier exemple s’accorde en genre avec le sujet (masculin) et avec l’objet (neutre).

Autre exemple, déjà vu à propos du type polysynthétique. Ici, on observe l’incorporation de l’objet partitif (une certaine quantité de …)

nahuatl
ooninakakwah = j’ai mangé de la viande
oo+ni+naka+kwa+h
PASSÉ+1SG+viande+manger+ACCOMPLI

Une hirondelle ne fait pas le printemps et un exemple ne suffit pas à se prononcer sur l’appartenance d’une langue à un type, d’autant plus qu’elles sont loin d’être homogènes. Certaines langues peuvent être cependant considérées comme des prototypes dans la mesure où tous les domaines de la langue sont marqués par un des procédés de formation des mots qui caractérisent les types morphologiques. Ces domaines sont la flexion des noms (déclinaison) et des verbes (conjugaison) et la dérivation lexicale. C’est donc à la fois en syntaxe et dans le lexique que se manifestent les propriétés qui touchent à la structuration du mot. Comme cela a été dit précédemment, des langues comme le chinois et le vietnamien peuvent être tenues pour le prototype des langues isolantes. De même que le turc et le finnois représentent des prototypes de langues agglutinantes. D’autres langues ont un statut moins net car on trouve des mots qui relèvent aussi bien d’un type que d’un autre. On définira donc plutôt des tendances pour ces langues. L’anglais est exemplaire sur ce point, car sa dérivation lexicale est clairement de nature agglutinante (childhood enfance = child + hood, childless sans enfants = child + less, baker boulanger = bake + er) alors que sa syntaxe tend très nettement vers le type isolant. On considère d’ailleurs parfois l’anglais comme relativement proche du chinois sur ce point (la même chose vaut pour les langues scandinaves). Cette impression vient du fait que l’anglais à une flexion des mots très pauvre. Le nombre des variations est très réduit ; il y a en tout et pour tout huit morphèmes flexionnels dans cette langue ;

anglais
-s = pluriel
-s = génitif
-s = 3SG (présent)
-ed = prétérit
-ing =participe présent
-en = participe passé
-er = comparatif
-est = superlatif

Qu’en est-il du français ? On observe aussi bien de l’agglutination que de la fusion, et ce, aussi bien en dérivation (lexique) qu’en flexion (syntaxe) :

agglutination fusion
lexique invisibilité
vendeuse
syntaxe chantions
maisons
chantâmes
sont
chevaux
beau

Dans ce tableau, les segments qui relèvent de la fusion de morphèmes sont soulignés. On remarquera que le mot cheval/chevaux s’analyse comme un tout ; il serait absurde de segmenter en *chev + al et *chev + aux comme on peut le faire pour les mots dérivés du type normal/normaux (norm + al et norm + aux).

La présence de la fusion dans certaines formes nominales, adjectivales et verbales suffit cependant à caractériser le français comme langue fusionnante (ou comme une langue plutôt fusionnante si l’on veut relativiser) car par opposition, les langues agglutinantes ne présentent pas de cas de fusion. Il suffit donc qu’il y ait fusion pour parler de langue fusionnante.