Première partie du cours : typologie des langues

2.5. Corrélations entre les différentes classifications

Mis à part la classification aréale qui repose sur la distribution géographique d’une propriété typologique due à un emprunt ou à un phénomène de convergence, il n’y a pas de liens nécessaires entre les différentes classifications des langues. Tout au plus, peut-on dégager des tendances ou des singularités. La distribution géographique des langues dans le monde ne coïncide pas avec une répartition équivalente sur le plan génétique et typologique. En Europe, par exemple, on trouve aussi bien des langues indo-européennes – la majorité – (français, anglais, suédois, russe, letton, irlandais…) que des langues finno-ougriennes (finnois, hongrois, estonien…). De même sur le plan typologique, il y a aussi bien des langues avec genre grammatical (français, italien, allemand, russe…) que des langues sans genre grammatical (anglais, basque, finnois…). On observe cependant des tendances ; les langues d’Europe sont surtout d’origine indo-européenne (le finnois, le hongrois, le basque font notamment exception), et elles sont, à une exception près (le basque), des langues nominatives. Les mêmes observations valent pour les autres grandes répartitions géographiques. L’Australie, avec ses langues aborigènes, comme on l’a vu précédemment, apparaît comme une singularité ; à un territoire donné correspond un ensemble relativement homogène de langues sur le plan génétique et typologique, si bien que le terme même de langues aborigènes d’Australie désigne à la fois une distribution géographique et une famille de langues, voire même un type de langues si l’on prend en compte tout un faisceau de propriétés communes à ces langues. Inversement, on entend parfois parler à tort de langues d’Afrique comme un ensemble qui serait homogène alors qu’il existe une très grande diversité génétique et typologique.

Si on laisse de côté le cas particulier des langues indo-européennes dont la diffusion dans le monde est liée à la colonisation, les familles de langues et les divers regroupements génétiques (cette fois on adopte le point de vue inverse) ont une distribution géographique relativement homogène dont l'étendue territoriale, qu'elle soit continue ou qu'elle résulte d'un essaimage, s'explique par le passé commun des langues de la famille et par les grands mouvements de populations. Voir à ce propos la carte des grandes familles de langues (document 3) ainsi que la page personnelle de Merritt Ruhlen (lien 2) qui contient une carte des 12 super-familles proposées par J.H. Greenberg. Une carte telle que celle publiée dans l’Atlas des langues de Bernard Comrie, Stephen Matthews et Maria Polinsky (dir.) en 2004, est plutôt une carte de géographie des langues puisqu'elle prend en compte les langues indo-européennes parlées en Amérique (langues ayant un statut officiel dans les divers pays de ce continent). Notons que les langues indo-européennes parlées en Afrique et ayant aussi un statut officiel ne sont pas systématiquement mentionnées sur la carte, sauf l'anglais et l'afrikaans (langue dérivée du néerlandais) de l'Afrique du sud. Certaines familles de langues des deux premières cartes ont une étendue plus vaste que la somme des territoires ayant des locuteurs natifs car la distribution géographique des langues de ces familles se caractérise plus par un essaimage que par une continuité territoriale. C'est particulièrement vrai des langues ouraliennes dont la plupart sont parlées par de petites communautés disséminées sur une zone qui doit être interprétée comme l'extension maximale de la famille, sans compter qu'elles sont parfois éparpillées sur des territoires où dominent une langue indo-européenne. Ce qui est vrai d'une famille, l'est également de langues particulières comme le rom ou romani – langue indo-européenne dérivée du sanskrit et parlée par la communauté tzigane – qui est dispersé aux quatre coins de l'Europe.

Alors que la quasi totalité des familles et super-familles présentent une continuité territoriale, la super-famille déné-caucasienne, proposée par Ruhlen, qui englobe notamment les langues sino-tibétaines d’Asie et les langues na-déné d’Amérique du nord présente un cas intéressant d’essaimage puisqu’une partie des langues se situe en Asie et l’autre en Amérique (on en trouve également en Europe et dans le Caucase). Cet essaimage correspondrait à une des plus anciennes grandes migrations de populations (la seconde après le premier mouvement migratoire à partir de l’Afrique), d’Asie vers l’Amérique du nord par le détroit de Béring. L’hypothèse récente du regroupement des langues sino-tibétaines et des langues na-déné (initiée par Sapir au début du XX^e siècle) et défendue récemment par Ruhlen [1997] n’est toutefois pas acceptée par tous et fait l’objet de nombreuses controverses.

L’évaluation du rapport entre la classification génétique et la classification typologique doit tenir compte du fait que les langues sont plutôt conservatrices et que les changements structuraux ne s’observent qu’à long terme, contrairement aux variations et modifications lexicales qui se font beaucoup plus facilement. On peut ainsi observer que les groupes de langues, telles les langues romanes, les langues germaniques, les langues celtes, ou les langues slaves, présentent de nombreuses similitudes dans leur structure interne. Notons cependant, que l’anglais et l’allemand, deux langues germaniques de la même branche (branche occidentale) se distinguent par deux propriétés pertinentes pour la classification typologique : l’allemand a un genre grammatical et un système de cas, alors que l’anglais n’a ni l’un ni l’autre. Pour être plus précis sur ce point, on nuancera en faisant intervenir un point de vue historique ; l’anglais n’a plus de genre ni de cas. Il en reste seulement des traces dans le système pronominal (he/she/it et him/her/it). Plus le niveau de regroupement est bas dans la hiérarchie de la classification génétique, et plus le faisceau de propriétés typologiques est conséquent. À l’autre bout de l’échelle – celui de la famille ou de la super-famille – il n’est pas rare de constater une différence significative entre une ou plusieurs langues et toutes les autres langues de la même famille. Hjelmslev [1966] mentionne le cas de l’arménien dont la déclinaison des noms en fonction de la catégorie du nombre et du cas, manifeste une structuration des morphèmes typique des langues agglutinantes alors que les langues indo-européennes auxquelles il appartient sont dans leur ensemble des langues plutôt fusionnantes (ces notions de typologie morphologique seront développées par la suite. On retiendra ici le fait qu’une langue d’une famille donnée peut présenter des éléments de structuration propres à une autre famille de langues.) Ce changement dans la forme des mots en arménien s’explique par la proximité géographique des langues altaïques qui sont typiquement des langues agglutinantes. De plus, la forme du pluriel en arménien (hayer = hay + er “les/des arméniens”, hay = “arménien”) n’est pas sans rappeler celle du turc (evler = ev + ler “les/des maisons”, ev = “maison”). Autre exemple : les langues finno-ougriennes sont connues pour être des langues agglutinantes. On observe cependant en estonien une évolution de la forme fléchie des mots qui tend vers la fusion ; on opposera ainsi l’exemple agglutinant du génitif finnois (jalan = jala + n “du pied”, jalka = “pied”) avec ce même génitif en estonien (jala = “du pied”, jalg = “pied”) où cette fois il n’est pas possible de segmenter le mot en deux morphèmes. L’identification du génitif se fait alors à partir de la forme globale du mot. Le morphème lexical et le morphème de génitif fusionnent en une forme de mot qui n’est plus décomposable en segments distincts (la forme estonienne s’explique par la disparition de la consonne finale, marque du génitif dans les langues fenniques).

Compte-tenu de ces remarques, on observera que les regroupements génétiques ne sont pas nécessairement liés à un type donné, mais que des tendances plus ou moins fortes s’observent selon les familles. Les deux cas de figure extrêmes sont les langues indo-européennes et les langues altaïques. Dans les langues indo-européennes on trouve des langues qui tendent vers l’isolation (anglais, suédois…), des langues fusionnantes (français, letton…) ainsi qu’une langue agglutinante (arménien). À l’opposé, les langues altaïques sont toutes du type agglutinant.

Si l’on prend en considération maintenant non pas une propriété unique mais un ensemble de propriétés, alors il est possible d’obtenir une caractérisation plus satisfaisante des familles. Les langues ouraliennes sont des langues agglutinantes, nominatives, dont l’ordre neutre des constituants de la phrase est SOV (sujet-objet-verbe), et ces langues ont des postpositions. Ce type de caractérisation admet cependant des écarts significatifs. Dans l’exemple précédent, le finnois est une langue SVO et non SOV, il n’est pas pour autant un contre-exemple dans la mesure où il vérifie toutes les autres propriétés. Voir à ce propos, la caractérisation que donne Lazard (1990) des langues d’Europe. Il s’agit cette fois de la distribution d’un ensemble de propriétés sur une zone géographique.

Une caractérisation d’une famille de langues à partir d’un ensemble de propriétés structurales peut cependant échouer si ces propriétés sont interprétées comme suffisantes pour identifier une langue quelconque comme appartenant à cette famille.

Le linguiste N. S. Trubetzkoy (1939) avait proposé de caractériser les langues indo-européennes par les six propriétés suivantes :

“Il n’y a pas d’harmonie vocalique.”
“Le consonantisme à l’initiale n’est pas plus pauvre que celui de l’intérieur ou de la finale.”
“Le mot ne doit pas nécessairement commencer par la racine.”
“Les formes ne sont pas constituées seulement par des affixes, mais aussi par des alternances vocaliques à l’intérieur des morphèmes radicaux.”
“Outre les alternances vocaliques, les alternances consonantiques libres jouent aussi un rôle morphologique.”
“Le sujet d’un verbe transitif est traité comme le sujet d’un verbe intransitif.”

Ces différentes propriétés sont de nature phonologique (1 et 2), morphologique (3, 4 et 5) et syntaxique (6).

Commentaire et illustration à partir des données du français (et de l’anglais) :

Propriété 1
L’harmonie vocalique est bien connue notamment dans langues ouraliennes et altaïques et dans certaines langues d’Afrique comme le yoruba ou l’igbo. Dans ces langues, la distribution des voyelles au sein du mot n’est pas libre ; la présence d’une voyelle donnée conditionne la présence des autres voyelles (un mot turc qui contient la voyelle “a” ne peut pas contenir la voyelle “e”). En outre, la suffixation est soumise à un processus d’ajustement du vocalisme du suffixe (les mots turcs ev “maison” et kar “neige” ont pour pluriel respectif evler et karlar, -ler/-lar étant le suffixe de pluriel sous deux formes différentes selon la nature des voyelles du radical). En français, la distribution des voyelles dans le mot ne connaît aucune contrainte et l’affixation (préfixation ou suffixation) est insensible au vocalisme du radical.

Propriété 2
La gamme des consonnes qui peuvent être en début de mot est exactement la même que celle qui se rencontre dans le mot ou en fin de mot. La consonne /ɲ/, par exemple, se trouve en début de mot dans /ɲol/ gnôle, en fin de mot dans /viɲ/ vigne et en position intervocalique dans /oɲɔ̃/ oignon.

Propriété 3
Autrement dit, l’affixation, qu’elle soit de nature syntaxique (flexion) ou lexicale (dérivation) n’est pas uniquement une suffixation. En dérivation française, on a aussi bien des suffixes (acceptable, vendeur…) que des préfixes (défaire, injuste…). De même pour les clitiques ; on a aussi bien des enclitiques (donne-m’en, prends-le… ) que des proclitiques (le dire, je le lui donne…).

Propriété 4
La flexion des mots ne se fait pas uniquement par affixation mais également par la variation vocalique du mot. Sur ce point, les exemples français ne sont pas probants. Ceux de l’anglais sont plus explicites ; le prétérit se forme soit par suffixation du morphème -ed (arrived, stopped…) soit par variation de la voyelle du radical verbal (sing/sang, give/gave…).

Propriété 5
De nouveau, les exemples anglais seront plus évidents pour illustrer cette propriété. La formation du prétérit peut également se faire par l’alternance de la consonne finale (send/sent, make/made…). En français, les exemples font défaut ; on a cependant l’opposition entre savent et sachent.

Propriété 6
Cette propriété est l’une des caractéristiques des langues nominatives. Une autre formulation de cette propriété serait par conséquent ; les langues indo-européennes sont des langues nominatives. Telle qu’elle est énoncée par Troubetzkoy, la propriété semble banale. En fait, l’identité de comportement entre le sujet d’une phrase transitive et le sujet d’une phrase intransitive ne va pas de soi. En français, comme dans beaucoup de langues, le sujet des phrases transitives et intransitives s’accorde avec le verbe en nombre et en personne, alors que dans les langues ergatives le sujet d’une phrase intransitive s’accorde avec le verbe dans les mêmes conditions que l’objet de la phrase transitive. Dans ce second type de langues, ce n’est pas le sujet de la phrase transitive qui s’accorde avec le verbe mais l’objet. Le statut des langues nominatives et des langues ergatives sera amplement développé plus loin.

Benveniste a montré que l’ensemble de ces propriétés étaient présentes en takelma, langue de la famille penutia, parlée dans l’Oregon (Voir à ce propos l’article d’E. Benveniste "La classification des langues" publié dans Problèmes de linguistique générale I et II (1974), tome I). Cette critique ne remet pas en cause la possibilité d’une caractérisation d’une famille au moyen d’un ensemble de propriétés structurales ; il suffit simplement de trouver le bon ensemble de propriétés. Par contre, il est tout à fait hasardeux de déduire l’appartenance à une famille de langues à partir d’un faisceau de propriétés typologiques. Au mieux, c’est un indice, et l’appartenance à une famille ou à un quelconque regroupement génétique ne peut être établi que par la méthode comparative.

Si l’on prend maintenant le rapport inverse entre la classification génétique et la classification typologique, les choses sont plus nettes ; les différents types de langues se rencontrent dans de nombreuses familles de langues ; on trouve des langues agglutinantes dans les langues ouraliennes (Europe : hongrois…), dans les langues altaïques (Asie : mongol…), dans les langues bantoues (Afrique : swahili…), dans les langues amérindiennes (Amérique du sud : quechua…), dans les langues austronésiennes (Pacifique : indonésien…) et dans des langues génétiquement isolées telles que le basque, le coréen et le japonais. Autre exemple, on trouve le genre grammatical sous des formes diverses (genres, classes, classificateurs) dans des langues indo-européennes (Europe : français, espagnol, gallois…) dans des langues nigéro-congolaises (Afrique : swahili, lingala, zoulou…), dans des langues nakho-daghestaniennes (Caucase : avar, lak, lesghien…), dans des langues sino-tibétaines (Asie : chinois, vietnamien, lao…). Les langues ergatives se rencontrent dans les langues kartvéliennes (Caucase : géorgien…), dans les langues sino-tibétaines (Asie : tibétain…), dans les langues amérindiennes (Amérique du sud : quiché…) et dans les langues aborigènes d’Australie (dyirbal…).

Les relations entre les différentes classifications des langues peuvent se résumer en six propositions. On s’en tiendra aux propositions essentielles, chacune d’elles étant illustrée par un exemple.

représentation schématique des relations entre les différentes classifications des langues résumées en six propositions. Le schéma adopte une forme triangulaire. Le sommet du triangle s'appelle regroupements géographiques, la base gauche du triangle regroupemements génétiques et la base droite regroupements typologiques. Une flèche qui va de regroupements géographiques à regroupements génétiques correspond à la proposition 1 : a. un regroupement géographique ne correspond pas à un regroupement génétique et b. un regroupement géographique peut être génétiquement homogène. Une flèche va de regroupements génétiques à regroupements géographiques, elle correspond à la proposition 2 : a. un regroupement génétique n'est pas nécessairement lié à une distribution géographique et b. les grandes familles de langues ont une distribution géographique homogène. Une flèche part de regroupements géographiques et pointe vers regroupements typologiques, elle correspond à la propposition 3 : a. un regroupement géographique ne correspond pas à un type linguistique et b. un regroupement géographique peut présenter un faisceau de propriétés typologiques. Une quatrième flèche part de regroupements typologiques et pointe vers regroupements géographiques, elle correspond à la proposition 4 : un type de langues n’est pas lié à une distribution géographique homogène. Une cinquième flèche part de regroupements génétiques et se dirige vers regroupements typologiques pour représenter la proposition 5 : les regroupements génétiques sont relativement homogènes quant à leur type linguistique. Une sixième et dernière flèche va de regroupements typologiques vers regroupements génétiques et correspond à la proposition 6 : un type linguistique n'est pas spécifique à un regroupement génétique donné.

a. Un regroupement géographique ne correspond pas à un regroupement génétique.
(Les langues d’Europe ne sont pas toutes des langues indo-européennes.)
b. Un regroupement géographique peut être génétiquement homogène.
(Les langues d’Australie sont génétiquement homogènes.)
a. Un regroupement génétique n’est pas nécessairement lié à une distribution géographique.
(Les langues indo-européennes se distribuent sur plusieurs continents.)
b. Les grandes familles de langues ont une distribution géographique homogène.
(Les langues ouraliennes s’étendent d’Asie en Europe.)
a. Un regroupement géographique ne correspond pas à un type linguistique.
(Les langues d’Afrique ne sont pas toutes des langues avec classes nominales.)
b.Un regroupement géographique peut présenter un faisceau de propriétés typologiques.
(Les langues d'Europe partagent plusieurs propriétés typologiques (G. Lazard, 1990).)
Un type de langues n’est pas lié à une distribution géographique homogène.
(Les langues agglutinantes sont présentes un peu partout dans le monde.)
Les regroupements génétiques sont relativement homogènes quant à leur type linguistique.
(Les langues ouraliennes sont de type agglutinant et sont du type SOV.)
Un type linguistique n’est pas spécifique à un regroupement génétique donné.
(Les langues ergatives se rencontrent dans plusieurs familles de langues.)