Première partie du cours : typologie des langues

5. Typologie polythétique : typologie morphologique de Sapir

Dans cette partie, nous ne verrons qu’un seul exemple de typologie polythétique. Il s’agit de la typologie de Sapir. La classification des langues qu’il propose constitue en quelque sorte la version le plus aboutie de la typologie à base morphologique.

Nous avons vu précédemment que les langues se répartissent en fonction de leur degré de synthèse et en fonction de leur type morphologique. Ces deux classifications ne sont pas indépendantes car elles reposent l’une et l’autre sur la relation entre morphèmes et mots. Les langues analytiques sont nécessairement des langues isolantes et inversement, les langues isolantes sont nécessairement des langues analytiques, car si dans une langue, un mot ne contient qu’un seul morphème, les morphèmes, en retour, renvoient à des mots simples. De même pour la relation entre le type polysynthétique et le type morphologique incorporant ; si un mot peut contenir plusieurs lexèmes sans qu’il soit question de composition, il y a alors nécessairement un processus d’incorporation. Reste le type synthétique qui correspond à deux modes de réalisation des morphèmes dans le mot : l’agglutination et la fusion.

degré de synthèse		type morphologique
type analytique		type isolant
type synthétique		type agglutinant
type synthétique		type fusionnant
type polysynthétique		type incorporant

La relation biunivoque entre le type analytique et le type isolant, ainsi qu’entre le type polysynthétique et le type incorporant a pour effet que les deux termes sont souvent considérés comme synonymes. On peut trouver notamment des descriptions typologiques fondées sur les types isolant, agglutinant, fusionnant et polysynthétique. On se gardera bien de confondre les deux typologies car l’approche n’est pas la même.
Sapir [1921, 1970 pour la traduction française] propose une typologie à base morphologique fondée sur trois critères :

le degré de synthèse
le type morphologique
la nature des concepts (ou le type conceptuel)

Les deux premiers critères ont été développés dans le chapitre précédent. Sapir distingue en fait cinq types morphologiques et non quatre. Il ajoute aux quatre types courants, le type symbolique à propos duquel il précise cependant qu’il est une variété du type flexionnel (type fusionnant). Il correspond en fait au type fusionnant à flexion interne (cf. § 4 et 5 de la sous-partie 4. 2. 2. 3 Type fusionnant). Cette distinction ne sera pas prise en compte ici. Reste à voir la nature des concepts.

Les trois critères sont liés. Avec les deux premiers critères il s’agit d’évaluer la nature formelle du rapport entre les mots et les morphèmes. Le troisième critère fait intervenir ce que les morphèmes et les mots véhiculent comme information. Il s’agit donc cette fois d’une typologie fondée sur la signification des morphèmes.

Sapir répartit les concepts associés aux morphèmes en quatre groupes selon leur mode de formation et selon leur fonction :

les concepts de base (groupe I)
les concepts dérivationnels (groupe II)
les concepts relationnels concrets (groupe III)
les concepts relationnels abstraits (groupe IV)

Les concepts de base et les concepts dérivationnels s’appliquent aux mots alors que les concepts relationnels s’appliquent aux relations entre constituants syntaxiques.

Les concepts de base forment des unités indépendantes dans les langues. Ces concepts correspondent à des entités, des procès, des propriétés, des actions, des états… Les mots maison, regarder, jeune, lire, joie… sont des mots indépendants qui expriment des concepts de base.

Les concepts dérivationnels sont représentés dans les langues par des morphèmes ou des traits morphologiques associés à un lexème. La signification globale du mot est alors le produit d’une signification quelconque associée au lexème de base et d’une signification incomplète associée au morphème dérivationnel. Quelques exemples de morphèmes dérivationnels en français dans leur version incomplète (la part correspondant au lexème manquant est représentée par les points de suspension) :

-eur/-euse : celui/celle qui…
-able/-ible/-uble : qui peut être…
-dé-/dés- : action contraire de…

Ces bouts de signification constituent des concepts dérivationnels dès lors que leur emploi implique une construction avec un lexème de base :

construction	signification
[chant]+[eur/euse] = chanteur/chanteuse	[celui/celle qui] + [chante]
[lav]+[-able/-ible/-uble] = lavable	[ce qui peut être] + [laver]
[dé-/dés-]+[monter] = démonter	[action contraire de] + [monter]

Les concepts relationnels concrets ont une double fonction dans la langue ; ils véhiculent un contenu sémantique (ils sont concrets) et ils indiquent une relation de dépendance entre des mots d’un énoncé. Les prépositions spatiales (sur, devant, contre, après, sous…) indiquent un certain type de relation spatiale – elles ont donc une signification concrète – et elles sont de nature relationnelle dans la mesure où elles mettent en relation deux entités. Les marques de personne sur le verbe sont également de ce type car elles reprennent l’information concernant les arguments du verbe (personne) et elles indiquent les fonctions de ces arguments (sujet et/ou objet). Le morphème de temps des verbes est également un concept relationnel concret, car il donne une information temporelle sur le procès décrit par le verbe (le morphème de temps a donc un contenu sémantique) et il structure l’énoncé en définissant une structure de phrase (en français, toute phrase implique un verbe conjugué, et tout verbe conjugué implique une structure de phrase).

Les concepts relationnels abstraits sont comparables aux précédents mais sans contenu sémantique. La préposition française “de” n’a pas de signification ; elle établit simplement une relation de complémentation entre deux constituants. La même chose pour la conjonction de subordination “que” ; sa fonction est de relier deux phrases dont l’une est enchâssée dans l’autre. Les suffixes de cas accusatif et de cas génitif des langues à cas morphologiques sont également de nature purement relationnel. Le premier introduit une relation de complémentation entre un verbe et un constituant nominal et le second, une relation de complémentation entre deux noms. Dans les exemples finnois suivants le suffixe de génitif (-n) n’est associé à aucune signification particulière :

finnois
presidentin auto = la voiture du président
presidentin vaimo = la femme du président
presidentin puhe = le discours du président

Il est évident que toutes les langues ont des concepts de base et des concepts relationnels abstraits (groupes I et IV) ; les premiers sont représentés par des mots simples (toutes les langues ont des mots simples) et les seconds, par des mots ou des morphèmes grammaticaux (toutes les langues ont des mots-outils sans signification ; adpositions, cas, conjonctions, particules…). Les deux autres types de concepts peuvent être présents ou absents, ou bien encore, seulement un des deux. Les différentes combinaisons définissent quatre types de langues :

type A : langues ayant uniquement des concepts des groupes I et IV
type B : langues ayant des concepts des groupes I, IV et II
type C : langues ayant des concepts des groupes I, IV et III
type D : langues ayant des concepts des groupes I, IV, II et III

Les types de langues ainsi définis sont désignés respectivement :

type A : langues simples et pures
type B : langues complexes et pures
type C : langues simples et mixtes
type D : langues complexes et mixtes

Les termes simple et complexe font référence à la distinction entre concepts de base et concepts dérivationnels, tandis que les termes pure et mixte font référence à la distinction entre concepts relationnels abstraits et concepts relationnels concrets.

Combiné avec le degré de synthèse et le type morphologique, le critère de la nature des concepts est illustré par les prototypes suivants :

chinois = type {analytique, isolant et A}
turc = type {synthétique, agglutinant et B}
swahili = type {synthétique, agglutinant et C}
latin = type {synthétique, fusionnant et D}

Le chinois est du type A car cette langue n’utilise pas la dérivation pour former des mots complexes (sinon elle serait synthétique) mais uniquement la composition. Quelques exemples chinois de mots composés (transcription pinyin). Voir également les exemples comparables du vietnamien en 4. 2. 1. 1.

chinois
hăi yuán : mer + personne = marin
háng tiān yuán : navigation + ciel + personne = astronaute/taïkonaute
diàn năo : électricité + cerveau = ordinateur

Par ailleurs, un même mot en chinois peut correspondre à un concept de base ou à un concept purement relationnel. Selon son emploi, le mot gěi est soit un verbe signifiant “donner” soit une préposition introduisant un bénéficiaire (= “à”) :

chinois
nǐ gěi* tā shū* tu donner lui livre tu lui donnes un livre
nǐ jì yí fēng xìn gěi* tā* tu envoyer une lettre à lui tu lui envoies une lettre

Le turc est du type B car cette langue abonde en dérivation. Quelques exemples :

turc
killi = kil+li : argile+suffixe adjectival = argileux
ağrısız = ağrı+sız : douleur+suffixe privatif = indolore
süpürücü = süpür+ücü : balayer+suffixe agentif = balayeur
hastalanmak = hasta+lan+mak : malade+suffixe verbal+infinitif = devenir malade

Par ailleurs, les relations syntaxiques sont plutôt de nature abstraite car elles ne font pas intervenir de morphèmes avec contenu sémantique. La dépendance de l’adjectif par rapport au nom ne fait pas intervenir d’accord en nombre ; l’adjectif est invariable et seule sa place – devant le nom – permet de l’identifier comme épithète :

turc
güzel kız joli fille une jolie fille
güzel kızlar joli fille+PL de jolies filles

Autre exemple d’emploi minimaliste des morphèmes grammaticaux en syntaxe turque : dans une succession de verbes se rapportant à un même sujet, seul le dernier verbe est conjugué. Dans l’exemple qui suit, seul le dernier verbe contient les suffixes de temps (imparfait) et de personne (2PL) :

turc
erken kalkar, çabuk giyinir, işinize *giderdiniz* tôt se lever, vite s’habiller, votre travail aller+IMP+2PL Vous vous leviez tôt, vous vous habilliez vite (et) vous alliez à votre travail

Le swahili est une langue du type C : langue simple et mixte. La dérivation lexicale est peu productive dans cette langue. La formation des noms d’agent ou d’appartenance à un groupe ne font pas appel à un affixe dérivationnel comme dans beaucoup de langues (chanteur, islandais…) mais à la composition (mise en relation de deux mots indépendants) :

swahili
mwana-shule : enfant+école = écolier
mwana-sharia : enfant+loi = homme de loi
mwana-nchi : enfant+pays = citoyen

Les noms d’appartenance à un groupe sont systématiquement formés au moyen de mot mwana “enfant” pour indiquer la relation avec une personne.

Exemple de nom d’agent formé à partir d’un verbe :

mpiga-picha : frappe-image = photographe

Le swahili est une langue avec des concepts relationnels concrets ; ce point est illustré par l’omniprésence des phénomènes d’accord (en nombre et en classe nominale). Dans l’exemple suivant, l’information sur le nombre du sujet est reprise dans chacun des constituants syntaxiques. Les marques d’accord sont soulignées. La glose contient l’information relative au nombre (PL) et à la classe nominale (les classes nominales des langues bantou sont identifiées par un chiffre) :

swahili
wana wangu wale wamekufa PL²+enfant PL²+mien PL²+ce PL²+PARFAIT+être_mort “ces miens enfants sont morts”

Le latin est une langue de type D, car cette langue est à la fois riche en dérivation et sa syntaxe comporte également de nombreuses relations d’accord qui reprennent notamment le nombre. Nombre, genre grammatical et cas morphologique sont fusionnés dans la désinence des noms et des adjectifs (langue fusionnante à flexion externe). Exemples de dérivation :

latin
cantor : chanter+suffixe agentif = chanteur
petitor : chercher+suffixe agentif = candidat
quercetum : chêne+suffixe collectif = chênaie
amicus : aimer+suffixe adjectival = ami
mistesco : doux+suffixe verbal = s’adoucir

L’accord en nombre, genre et cas est particulièrement explicite dans l’exemple classique suivant (syntagme nominal dont la tête est un nom masculin au nominatif pluriel), où chaque mot – comme en swahili – comporte le même affixe :

latin
illi boni domini ce+[PL…] bon+[PL…] maître+[PL…] ces bons maîtres

Les exemples proposés par Sapir constituent des prototypes. Les langues retenues représentent des exemples francs du type illustré. Mais comme le précise Sapir, la frontière entre les types A et B d’une part et les types C et D d’autre part – opposition entre le type pur et le type mixte – est ténue dans la mesure où la différence entre ces deux types repose sur l’évaluation du contenu sémantique des morphèmes grammaticaux impliqués dans les relations syntaxiques. Nous n’avons retenu ici que le nombre, le temps et la personne car ces catégories ont clairement un contenu sémantique. En revanche, c’est plus délicat lorsqu’il s’agit d’évaluer le contenu sémantique de la catégorie du cas parce que cette catégorie contient aussi bien des cas sans contenu sémantique (nominatif, accusatif…) que des cas avec contenu sémantique (il s’agit alors de cas morphologiques équivalents à des prépositions (locatif, instrumental…), sans compter les cas dont le contenu sémantique est variable selon les langues ; les cas ergatif et génitif notamment peuvent être purement abstraits (relation entre sujet et un verbe pour l’ergatif, et relation entre deux noms pour le génitif) ou être un tant soit peu concrets lorsque leur emploi est limité à l’agent pour l’ergatif et à la possession pour le génitif.

Par ailleurs, la distinction entre les types A et C d’une part et les types B et D d’autre part – opposition entre le type simple et le type complexe est également une affaire de gradation car l’évaluation de la dérivation lexicale est liée au rendement des affixes dérivationnels. Une langue ayant de nombreux dérivés mais dont le rendement est faible n’est pas considérée comme une langue de type complexe. La difficulté est évidemment accrue lorsque la dérivation n’est pas homogène ; présence à la fois de dérivés productifs et de dérivés à faible rendement. En dérivation française, par exemple, les suffixes dérivationnels productifs tels que -eur/euse (chanteur, blogueur…) et -iser/ifier (fragiliser, sénégaliser…) côtoient des suffixes dérivationnels obsolètes tels que -aille (trouvaille, fiançailles…) ou -aison (salaison, crevaison…).

Pour comprendre la notion de productivité d’un suffixe dérivationnel, il suffit de comparer le cas du suffixe agentif français -eur/-euse avec son équivalent en finnois, langue dans laquelle la nature complexe du type conceptuel ne fait aucun doute. Le suffixe d’agent est -ja/-jä et il peut apparaître quasiment avec tous les verbes, même si la notion d’agentivité est faible :

finnois
ajaa conduire, ajaaja conducteur/conductrice
myy vendre, myyjä vendeur/vendeuse
rakastaa aimer, raskastaja amant(e)
odottaa attendre, odottaja celle qui attend (un enfant)

Comme le montre la traduction, il n’est pas possible d’ajouter systématiquement le suffixe -eur/-euse pour obtenir un nom d’agent en français (celui qui apprend le français doit apprendre si le mot existe ou non). Donc, en français, on ne peut pas dire que tous les verbes acceptent le suffixe d’agent -eur/-euse, et d’autre part, le suffixe -eur/-euse ne s’applique pas uniquement à des agents (humains, par définition) mais également à des instruments (téléviseur, photocopieur, photocopieuse, agrafeuse…).

Le tableau des types de structure linguistique d’ E. Sapir (1921), pp. 150-151 (document 4) reprend tous les cas de figure de sa typologie polythétique. Dans ce document, le terme mêlé remplace mixte, la technique renvoie au type morphologique et le caractère renvoie au degré de synthèse. Dans les colonnes des groupes, les lettres minuscules signalent le type morphologique utilisé pour l’expression du concept correspondant :
a = isolation
b = agglutination
c = fusion externe
d = fusion interne

Ainsi pour le turc, les concepts du type II et IV (langue complexe et pure) sont représentés dans la langue par des mots qui se présentent sous la forme d’une agglutination de morphèmes dérivationnels ou flexionnels ajoutés à une base lexicale (b). Lorsqu’il y a plusieurs lettres, l’ordre signale une hiérarchisation des techniques. Le latin, par exemple, est marqué “c, d” pour les groupes II et III ; ce qui signifie qu’il utilise plutôt la fusion externe que la fusion interne pour les mots dérivés et pour les mots fléchis.