La famille indo-européenne

Groupe	Sous-groupes et langues
Indo-iranien	Indien: sanskrit^†, hindi, ourdou, bengali, marathi, bihari, gujarati, panjabi, oriya, rajashatni, népalais, assamais, boundeli, sindhi, konkani, pahari, cinghalais, santali, tsigane, etc. Iranien: avestique^†, persan (farsi/dari/tadjik), afghan (pachtou), kurde, baloutchi, hazara, aïmak, ossète, talysh, tat, etc.
Grec (isolat)	grec ancien^†, grec moderne
Italique (ou langues romanes)	osque^†, ombrien^†, vénète^†, messapien^†, rhétique^†, latin^† italien, français, espagnol, catalan, portugais, galicien, mirandais, occitan, franco-provençal, sarde, roumain/moldave, romanche, ladin, frioulan, sicilien, dalmate^†, etc.
Celtique	gaulois^† breton, gallois, cornique^† irlandais, écossais, mannois^†
Germanique	gothique^† danois, suédois, norvégien (bokmål et nynorsk), islandais, féroïen anglais, frison, allemand, néerlandais, afrikaans
Balte	vieux prussien^†, lituanien, letton
Slave	polonais, tchèque, slovaque, sorabe serbo-croate, slovène, bulgare, macédonien russe, biélorusse, ukrainien et ruthène
Arménien (isolat)	arménien de l'Ouest, arménien du Nord, arménien de l'Est
Albanais (isolat)	albanais (tosque et guègue)
Isolats divers	hittite^†, tokharien, lykien^†, lydien^†, louvite^†, phrygien^†, thrace^†, etc.

REMARQUE: ^† = langue éteinte.

Le terme indo-européen a été introduit en 1816 par l'Allemand Franz Bopp pour désigner un ensemble de langues d'Europe et d'Asie (incluant le nord de l'Inde avec l'Iran, l'Afghanistan, le Pakistan et le Bangladesh) dont la parenté structurale s’est révélée remarquable. Le sanskrit, le grec, le latin, le hittite, le vieil irlandais, le gothique, le vieux bulgare, le vieux prussien, etc., présentent effectivement des liens communs surprenants. Cela signifie que la plupart des langues d'Europe et une grande partie des langues de l'Iran, de l'Afghanistan, du Pakistan, du Bengladesh et de l'Inde appartiennent à la famille indo-européenne.
La famille indo-européenne comprend notamment de nombreuses langues indo-iraniennes dont le sanskrit, l'hindi et le persan (farsi), le grec, les langues baltes comme le lituanien et le letton, les langues celtiques comme le breton, le gallois ou le gaélique écossais, les langues d'origine latine ou dites romanes) comme le français, l'espagnol, le catalan ou l'italien, les langues germaniques comme l'allemand, l'anglais ou le suédois, les langues slaves comme le russe, le polonais ou le serbe.

Cette famille de langues est celle qui a été la plus étudiée; c'est aussi celle dont on possède le plus de documents anciens et celle dont on peut établir des liens génétiques absolument sûrs.

1 Les langues indo-européennes

L'indo-européen primitif aurait donné naissance à plus de 1000 langues. En ce début du second millénaire, ces langues seraient parlées entre 2,5 et trois milliards de locuteurs, ce qui en fait la famille linguistique la plus importante du monde en fonction du nombre de ses locuteurs. Souvenons-nous que les langues indo-européennes sont parlées sur tous les continents, mais les gros contingents (voir la carte) se trouvent en Inde (900 millions), en Europe (700 millions) et en Amérique (800 millions).

Le tableau ci-haut présente une liste partielle de ces langues. Un nombre assez appréciable d'entre elles sont aujourd'hui disparues: le sanskrit, l'avestique, l'osque, l'ombrien, le latin, le grec ancien, le dalmate, le gaulois, etc. Les langues de la famille indo-européenne sont divisées ici en neuf groupes (appelés parfois branches ou sous-familles) et chacun d'eux (sauf l’albanais et l’arménien) compte un nombre plus ou moins élevé de langues.

- Les langues indo-aryennes (indo-iraniennes)

Dans la grande famille indo-européenne, c'est le groupe indo-iranien (ou indo-aryen) qui constitue l'ensemble le plus important, avec quelque 1,5 milliard de locuteurs et environ 400 langues; il s'agit de la moitié des locuteurs de toutes les langues indo-européennes. L'aire linguistique s'étend du Kurdistan turc jusqu'au centre de l'Inde, incluant une partie de l'Irak, puis l'Iran, le Pakistan, l'Afghanistan, le Bangladesh.

- Les langues germaniques

L'aire des langues germaniques (anglais, allemand, néerlandais, danois, etc.) est tout aussi remarquable: ses 450 millions de locuteurs couvrent le nord et le centre de l'Europe, puis l'ensemble de l'Amérique du Nord, une partie des Antilles ainsi que l’Australie et la Nouvelle-Zélande.

- Les langues romanes

Avec plus de 430 millions de locuteurs, les langues romanes (espagnol, portugais, français, italien, roumain, etc.), toutes issues du latin, sont représentées principalement en Europe (Portugal, Espagne, France, Italie, Roumanie) ainsi que dans toute l’Amérique du Sud, le Mexique, une partie des États-Unis et du Canada.

- Les langues slaves

Les langues slaves (russe, ukrainien, polonais, bulgare, etc.) constituent le quatrième groupe important. Les langues de ce groupe sont parlées sur le continent européen et comptent plus de 315 millions d'usagers.

- Les langues baltes

Près de la mer Baltique, le lituanien et le letton demeurent les seules langues baltes (5,5 millions de locuteurs) à avoir survécu.

- Les langues celtiques

Quant aux langues celtiques (breton, gallois, irlandais, écossais, etc.), elles sont toutes en voie d'extinction avec au total moins de deux millions de locuteurs.

- Les isolats linguistiques

L'albanais, le grec et l'arménien constituent des isolats parmi les langues indo-européennes modernes: ce sont les seules langues de leur groupe respectif. La famille indo-européenne comptent aussi un certain nombre d'autres isolats linguistiques qui ne sont rattachés à aucun groupe, mais ce sont des langues mortes. Parmi les langues éteintes, citons le tokharien autrefois parlé dans le Turkestan, des langues d’Asie mineure comme le hittite, le lykien et le lydien, le louvite, le phrygien et le thrace, qui sont disparus depuis la fin de l’Antiquité.

2 La question de l’origine des Indo-Européens

Les études historiques et comparatives des langues sont particulièrement intéressantes parce qu'elles ont fait naître l'idée qu'un peuple a existé en des temps très anciens: les Indo-Européens. Son existence est prouvée uniquement par des considérations linguistiques: aucun vestige historique (monuments funéraires, œuvres d'art, artisanat, etc.) ne l'atteste de façon sûre. Cela signifie qu'on ne peut pas parler des Indo-Européens comme on parle des Grecs ou des Romains: nous n'avons d'eux aucun texte, car leur civilisation est disparue avant l'apparition de l'écriture. On ne dispose même pas de témoignages contemporains comme pour les Gaulois, les Germains ou les autres «Barbares» connus des Grecs et des Romains. Donc, l'existence des Indo-Européens n'est pas une donnée de l'histoire, mais une hypothèse formulée à partir de la comparaison entre des milliers de mots. Par exemple, le mot mère se dit mater en latin, mothar en gothique, mathir en vieil irlandais, matar en sanskrit, etc.

Les études de comparaison entre les langues indo-européennes permettent de jeter une certaine lumière sur la civilisation et les institutions des Indo-Européens. Ces lointains ancêtres de nombreux peuples d'aujourd'hui que sont les Indo-Européens auraient fait leur entrée dans l'histoire aux environs du III^e millénaire (avant notre ère), donc vers la fin de la période de la pierre polie (néolithique). La communauté linguistique primitive s'est sans doute maintenue jusqu'au début de la période des métaux, car les langues utilisaient encore les mêmes mots pour désigner le cuivre (-2500 -1800). Au début du II^e millénaire, apparaissent déjà des langues différenciées, notamment en Anatolie (l'actuelle Turquie). Ainsi, au moment où l'on a distingué le cuivre du bronze (vers -1800), les langues s'étaient déjà fragmentées parce que chacune nommait à sa façon les différents métaux comme le bronze et le fer.

On sait aussi que les Indo-Européens étaient des tribus guerrières supérieurement organisées. Ils étaient en état de guerre permanente pour conquérir de nouveaux territoires et de nouveaux biens, mais aussi pour défendre leurs nouvelles acquisitions et pour réprimer les révoltes. La paix ne devait jamais être de très longue durée. La saison guerrière semblait commencer au printemps et ne s'achever qu'avec l'arrivée de l'hiver. Ils avaient domestiqué le cheval et disposaient de chars de combat d'autant plus puissants que les Indo-Européens connaissaient la métallurgie du fer.

Des études récentes nous révèlent d'où pourraient provenir les premiers Indo-Européens. Parmi les termes communs aux diverses langues de cette famille pouvant, par exemple, comporter une indication géographique, on relève des mots comme «bouleau», «hêtre», «saumon», etc., bref, des mots de la faune et de la flore. Selon diverses hypothèses, les premiers Indo-Européens proviendraient du sud de la fédération de Russie, c'est-à-dire d'une aire s'étendant du nord de l'Arménie et de la mer Caspienne jusqu'aux steppes de l'Asie centrale.
Entre 2000 et 1500 avant notre ère, grâce à leur puissante machine de guerre, les Indo-Européens ont pu envahir les grandes aires de civilisation de l'Europe et de l'Asie. Vers 2000, en Asie, ce sont les Indo-Aryens qui ont pénétré en Inde, puis les Hittites en Asie mineure (Turquie actuelle); la civilisation hittite est elle-même disparue vers 1300, probablement détruite par les "Peuples de la Mer", un peuple pirate d'origine indo-européenne. En Europe, vers 1800, les Hellènes se sont installés en Grèce, puis les Latins en Italie. Un peu plus tard, les Slaves, puis les Celtes, les Germains, les Baltes, ont envahi le reste de l'Europe. Vers l'an 1000, la séparation des Indo-Européens était depuis longtemps accomplie.

Tous ces peuples indo-européens parlaient déjà des langues différentes au moment où ils ont envahi l'Europe et l'Asie. On ignore à quoi ces langues ressemblaient vraiment et comment s'est effectué le processus de de fragmentation de la langue commune initiale. On sait cependant que ces langues présentaient de nombreux traits communs et on connaît ce qu'elles sont devenues en se différenciant de plus en plus avec le temps: le sanskrit en Inde, le vieux-perse en Iran, le grec en Grèce, le latin en Italie, le celtique en Europe centrale, le germanique en Europe de l'Est, le slave et le balte en Russie. Par la suite, ces langues se sont elles-mêmes fragmentées en une multitude d'idiomes et sont devenues les langues modernes que l'on connaît aujourd'hui: italien, espagnol, français, allemand, néerlandais, anglais, polonais, bulgare, russe, etc.

3 La reconstruction linguistique
Le travail de reconstruction historique s'appuie avant tout sur des ressemblances entre des langues dont on suppose, au départ, la parenté vraisemblable. Ces ressemblances doivent être soumises à un examen minutieux. Il ne faut pas oublier que des mots peuvent être accidentellement semblables d'une langue à l'autre, alors que d'autres mots très différents peuvent avoir la même origine.
Considérons le mot roi à partir de trois langues indo-européennes: le sanskrit, le latin et le grec.

sanskrit	latin	grec
radja	rex/regem	orego

La ressemblance entre radja en sanskrit et rex/regem en latin n'est pas fortuite: les deux mots correspondent par la forme et le sens. Le rapprochement avec le grec est différent. À la forme orego, le grec oppose comme sens «étendre en ligne droite»; au sens de «roi», correspondent les formes basileus et wanaks. De même, on serait tenté de rapprocher le mot sanskrit radjatam (argent), le mot radja (roi) et le mot latin rex/regis (roi). On serait alors victime d'une homonymie: il faut plutôt rapprocher le mot radjatam du mot latin argentum et du grec arguros qui signifient tous les deux «argent». On voit donc qu'il importe non seulement de tenir compte de la forme lorsqu'on établit des comparaisons, mais aussi du sens. Lorsqu'il y a conjonction des deux, les risques d'erreur sont moins grands. De plus, en comparant, il faut aussi reconstruire des règles d'évolution.

Ce genre d'étude implique que les comparatistes ont dégagé des règles de changement, c'est-à-dire des lois d'évolution. Le nombre de cas qui les vérifie d'une langue à l'autre garantit leur validité et leur pertinence. Comment dégage-t-on ces lois? Par la comparaison de mots dans diverses langues parallèles. La comparaison du latin pater, du grec pater, du sanskrit pitar et de l'anglais father montre bien que, dans toutes ces langues, le [r] final représente un [*r] indo-européen. Si, en sanskrit, en latin et en grec, le [p] et le [t] correspondent, il n'en est pas de même en anglais où [f] correspond à [p] (father - pater) et [th] à [t]. Cette constatation a donné à penser que les phonèmes de l'indo-européen commun [*p] et [*t] se sont maintenus en grec, en latin et en sanskrit, mais qu'ils sont passés respectivement à [f] et [th] dans une langue germanique comme l'anglais. Une fois que cette hypothèse a été vérifiée dans des quantités de mots, non seulement en anglais mais dans les autres langues germaniques (allemand, néerlandais, suédois, norvégien, etc.), on est en droit de formuler une loi d'évolution propre aux langues germaniques.

Les méthodes de la linguistique comparée, bien que fort complexes et d'application ardue, permettent donc de reconstruire une langue originelle et de déterminer avec précision le degré de parenté entre des langues. Plus encore, il est possible de dater certains événements avec presque autant de précision qu'on peut le faire avec la méthode du «carbone 14», grâce à des méthodes fournies par la glottochronologie; de même qu'on peut découvrir une partie des institutions des peuples anciens dont on ne possède aucun vestige, on peut découvrir leurs langues.

4 Les institutions indo-européennes

Il n'y a pas seulement dans le domaine de la phonétique ou de la phonologie où l'étude des langues anciennes est utile. Ainsi, la comparaison du vocabulaire indo-européen a également permis de découvrir une partie des institutions des Indo-Européens: économie, parenté, société, pouvoir, droit, religion, etc. Nous allons nous en tenir à un seul exemple à partir du grec et du latin, mais il permettra de comprendre la méthode utilisée.

Langue	«naître»	«connaître	«genou»
grec	gignomai	gignosco	gonu
latin	(g)nascor	(g)nosco	genu

Ces mots ont visiblement une racine commune qui apparaît tantôt sous la forme gon, tantôt sous la forme gen, tantôt sous la forme gn. Ils ont donc évidemment la même origine. Toutefois, comment concilier les sens apparemment disparates qu'ils comportent? Comment croire à une relation entre la «naissance», la «connaissance» et le «genou»? Or, il y a effectivement un lien entre ces trois réalités. Pour s'en convaincre, on lira les deux récits qui suivent. Il s'agit de récits littéraires d'origine hittite dont l'épisode de la naissance est développé en des termes assez semblables:

La femme d'Appu, enfanta un garçon. La sage-femme souleva le garçon, et le déposa sur les genoux d'Appu. Appu se mit à cajoler l'enfant, et à le dorloter. Il lui donna le meilleur nom: «Méchant». Puisque les dieux [...] ont pris la mauvaise route, et puisqu'ils ont gardé la mauvaise route, que son nom soit «Méchant».

Elle le mirent au monde, les sages-femmes, ce fils de Kumarbi. Les Parques et les augustes déesses le soulevèrent, sur les genoux de Kumarbi elles le déposèrent. Kumarbi se mit à cajoler le garçon, à le dorloter, il se mit à lui donner le meilleur nom. Kumarbi se dit à part lui: «Quel nom vais-je lui mettre, à ce fils que les Parques et les augustes déesses m'ont donné? Il a bondi hors du corps comme une flèche. Qu'il aille et que son nom soit Ullikummi (1).»

Ces récits nous apprennent que, chez les Indo-Européens, la naissance biologique devait être suivie d'une reconnaissance juridique, faute de laquelle l'enfant n'aurait pas été intégré au clan et, par voie de conséquence, n'aurait pu survivre. Mais comment le père reconnaissait-il son enfant? En le posant sur ses genoux! Le genoux est ainsi considéré comme le symbole de l'engendrement juridique. On peut sourire devant une telle conclusion, mais ce serait oublier qu'on peut faire des rapprochements similaires à partir de centaines de cas de ce genre. Le nombre de ces exemples sert ainsi à valider ce type de conclusion.
_________

(1) Texte tiré de LA ROCHE, Les noms des Hittites, Paris, Klincksieck, 1966.

Dernière mise à jour: 05 janv. 2024

Page précédente

Grandes familles linguistiques

Accueil: aménagement linguistique dans le monde