A la découverte des langues indo-européennes

Par Pierre

16 octobre 2015

Savez-vous quel est le point commun entre le français, le russe, l’albanais et le hindi ? Aucun, me direz-vous ? Bien au contraire : ils appartiennent tous à un seul et même ensemble, appelé « langues indo-européennes », qui regroupe un millier de langues et près de trois milliards de locuteurs. Partons à la découverte de cette étonnante famille de langues, qui s’est étendue de l’Atlantique à la Chine, avant de gagner les Amériques.

Cet article est un complément au dossier en trois parties sur les langues d’Europe. La majorité d’entre elles appartient au groupe indo-européen, mais pas toutes : certaines font partie d’autres familles de langues, comme le groupe finno-ougrien (hongrois, finnois, estonien) ou le groupe caucasien (tchétchène, abkhaze, géorgien), ou encore forment une famille propre, comme le basque.
Pour éviter toute redondance, je ferai donc fréquemment des renvois aux différentes parties de ce dossier, qui présente déjà en détails plusieurs langues indo-européennes.

Les langues indo-européennes, qu’est-ce que c’est ?

Il s’agit d’un concept de linguistique comparée, science qui étudie les liens de parenté qui existent entre les langues.

Histoire d’une science : la linguistique comparée

Dès la Renaissance, des savants européens remarquent des similarités entre les différentes langues d’Europe et supposent qu’elles sont liées par une origine commune. Au XVIIe siècle, le linguiste néerlandais Marcus Zuerius van Boxhorn propose une origine « scythique » au persan, au sanskrit et aux langues européennes. Au XVIIIe siècle, c’est au tour de Gaston-Laurent Cœurdoux, missionnaire jésuite français, de noter des ressemblances entre le sanskrit, le latin et le grec. Puis William Jones, philologue anglais et grand orientaliste, suppose que ces langues proviennent d’une seule et même langue, aujourd’hui disparue.
C’est en 1813 que l’Anglais Thomas Young introduit le terme de « langues indo-européennes », qui perdure encore aujourd’hui. Puis les travaux sur la grammaire de Franz Bopp, philologue allemand, consolident l’hypothèse d’une source commune grâce à une étude comparée de nombreuses langues (sanskrit, arménien, grec, latin, allemand…).

Les origines des langues indo-européennes

Les langues indo-européennes trouveraient leur origine dans une hypothétique langue mère, l’indo-européen commun. Cette langue préhistorique aurait existé avant l’invention de l’écriture, il n’en reste donc aucune trace écrite.
Pour remonter jusqu’à cette langue originelle, il faut se poser deux questions : où était-elle parlée en premier et par qui ? Il n’existe à l’heure actuelle aucun consensus et certains situent ce foyer indo-européen en Russie (steppe pontique), d’autres en Turquie (Anatolie), en Inde, dans le sud-est de l’Europe…

Un peuple indo-européen ?

Pour bien comprendre cette évolution, il convient de bien différencier peuple indo-européen et peuple de langue indo-européenne. Il n’y a probablement jamais eu un unique peuple indo-européen ayant colonisé l’Asie et l’Europe, mais plusieurs peuples qui ont adopté des langues indo-européennes. Ils ont ensuite migré ou conquis les terres de leurs voisins, poursuivant la propagation des langues indo-européennes. Pour illustrer cette distinction entre langue et ethnie, prenons un exemple proche de nous : au I^er siècle avant Jésus Christ, les habitants de la Gaule conquise par la République romaine ont commencé à abandonner leur langue au profit du latin, qu’ils ont en retour enrichi de vocabulaire gaulois.
Bref, vous l’aurez compris, il est important de faire preuve de nuance quant à la question d’une ethnie indo-européenne. Il a longtemps été question d’un peuple indo-européen originel, les Aryens. Ce nom ne vous rappelle rien ? Nul besoin d’en dire plus.

Une expansion en Europe et en Asie

Les langues indo-européennes se sont répandues depuis leur foyer originel au cours de la préhistoire, en direction de l’Europe et de l’Asie. L’hypothèse kourgane, la plus en vogue à l’heure actuelle, place cette origine entre le Dniepr en Ukraine et la Volga en Russie, au Ve millénaire avant Jésus-Christ.
Durant le premier millénaire, les langues indo-européennes se propagent jusqu’à l’Atlantique et au nord de l’Afrique à l’ouest, jusqu’à l’Inde et la Chine à l’est. Au cours du XVe siècle, elles commencent à se diffuser dans le monde entier, plus particulièrement sur le continent américain.

Hypothèse kourgane — La diffusion des langues indo-européennes selon l’hypothèse kourgane.

Classification des langues indo-européennes

Il serait vain de proposer dans cet article une classification exhaustive des langues indo-européennes, pour la simple et bonne raison qu’elles n’ont cessé de changer au cours des millénaires et qu’une bonne partie est aujourd’hui disparue.
Voyons plutôt quelles sont les grandes familles de langues, afin de donner une idée des liens de parenté qui existent entre elles.

Branche italo-celtique

Vous la connaissez bien, c’est la branche dont sont issues les langues romanes et celtiques. Il n’est pas établi qu’il y ait réellement eu une unique langue italo-celtique originelle, peut-être les deux groupes italique et celtique ont-ils simplement évolué de concert à cause de leur proximité géographique.

Les langues italiques ont donné naissance au latin, qui a connu une diffusion prodigieuse grâce aux conquêtes de la République puis de l’Empire romain. Puis le latin vulgaire, parlé par le peuple de l’Empire, a lui-même produit les langues latines : français, espagnol, portugais, italien, roumain…

Si les langues celtiques dominaient l’Europe au cours du Ier millénaire av. J.-C., leur aire géographique se réduit aujourd’hui à la Bretagne et aux îles britanniques. On distingue deux grands groupes : les langues gaéliques, parlées en Irlande, en Ecosse et sur l’Ile de Man, et les langues brittoniques, dont sont issus le gallois, le cornique et notre breton national.

Branche germanique

Il existait à l’origine une unique langue germanique, qui s’est divisé en trois groupes : le germanique oriental, dont toutes les langues sont éteintes (comme le gotique), le germanique septentrional, qui a donné les langues scandinaves (suédois, danois, norvégien…), et le germanique occidental. Ce dernier est le groupe le plus important, puisqu’il comprend notamment l’anglais, l’allemand et le néerlandais.

Branche balto-balkanique

Du groupe balkanique (aussi appelé « thrace et illyrien »), seul l’albanais est encore parlé de nos jours. Cet isolement fait de l’albanais une langue isolée dans l’ensemble indo-européen.
La répartition des langues balto-slaves fait aujourd’hui débat. Certains linguistes placent d’un côté les langues baltes et de l’autre les langues slaves, tandis que d’autres forment trois groupes équidistants, les langues baltes occidentales, les langues baltes orientales et les langues slaves.
Dans tous les cas, les langues baltes occidentales (comme le vieux prussien) sont aujourd’hui éteintes et deux langues baltes orientales ont survécu : le letton et le lithuanien.

Les langues slaves sont elles-mêmes divisées en trois groupes : occidental (polonais, tchèque, slovaque), oriental (russe, ukrainien, biélorusse) et méridional (slovène, serbo-croate, bulgare, macédonien).

Branche helléno-phrygienne

De cette branche, il ne reste aujourd’hui que le grec moderne et ses différents dialectes. Comme l’albanais, le grec est donc une langue isolée.

L’arménien

Encore un isolat linguistique. Les origines de l’arménien sont mal connues et certains linguistes essaient d’avancer une parenté avec le grec ancien, tandis que la majorité le place dans un ensemble à part. Aujourd’hui, il existe deux groupes arméniens, l’occidental et l’oriental qui est parlé en Arménie.
L’arménien présente la particularité d’être l’une des rares langues agglutinantes de la famille indo-européenne, c’est-à-dire qu’il ajoute des suffixes à la fin des mots.

Branche tokharienne

Les langues tokhariennes ont toutes disparu, mais je me permets de les inclure à cette liste de par leur caractère fascinant. Elles étaient parlées par un peuple méconnu, les Tokhariens, qui vivait dans l’actuelle région du Xinjiang en Chine.
Deux langues tokhariennes ont existé, l’agnéen (ou tokharien A) et le koutchéen (ou tokharien B), mais elles ont disparu dans la seconde moitié du Ier millénaire. L’image d’en-tête de cet article est issu des grottes de Kizil, vestiges de l’art tokharien.

Branche anatolienne

Il s’agit ici aussi de langues aujourd’hui éteintes. Comme leur nom l’indique, elles étaient autrefois parlées en Anatolie, c’est-à-dire dans la partie asiatique de la Turquie. La plus connue est sans doute le hittite, parlé par le peuple du même nom.

Branche indo-iranienne

Longtemps considéré comme la source des langues indo-européennes, l’indo-iranien est à présent vu comme une branche qui s’est scindée très tôt de l’indo-européen pour se diffuser en direction de l’Océan Indien.

Langues iraniennes

Le persan actuel est bien entendu le représentant le plus parlé des langues iraniennes. Il descend lui-même du vieux persan, parlé à l’ouest du monde iranien, par rapport à l’avestique qui lui était plutôt parlé à l’est et était très proche du sanskrit.
Le persan connaît lui-même des variantes régionales, comme le dari parlé en Afghanistan et le tadjik, principalement présent au Tadjikistan.

Au nord-ouest de l’Iran sont notamment parlés les langues kurdes et plus particulièrement le kurmandji. Le zazaki est souvent rattaché au groupe kurde.
Les langues iraniennes se sont aussi répandues jusque dans le Caucase, comme en témoigne l’ossète, parlé comme son nom l’indique en Ossétie, une région à cheval entre la Géorgie et la Russie.
Parmi les autres langues iraniennes parlées à l’ouest de l’Iran, on trouve notamment le lori et sa variante le bakhtiari, ou encore le tat, autre variété de persan. Notons également le kumzari, qui a la particularité d’être parlé en Oman, donc sur la péninsule arabique.

A l’est de l’Iran sont parlées les langues iraniennes orientales. La principale langue orientale est le pachto, présent en Afghanistan et au Pakistan. On trouve également le yaghnobi au Tadjikistan, ainsi que les langues parlées dans les monts Pamir. A noter que l’ossète, que nous avons évoqué au paragraphe précédent, fait partie de ce groupe oriental, même s’il est parlé au nord-ouest de l’Iran. Parfois, les classifications donnent le tournis.
Dans le même genre, le baloutche est une langue iranienne du nord-ouest, mais il est parlé à l’est de l’Iran, sur une région à cheval entre l’Iran, l’Afghanistan et le Pakistan, le Baloutchistan.

Langues indo-aryennes

Ce sous-groupe représente à lui seul environ la moitié des locuteurs de langues indo-européennes, soit environ 1,5 milliard de personnes ! Les langues indo-aryennes sont présentes dans les pays du sous-continent indien : l’Inde, le Pakistan, le Bangladesh, le Népal, le Sri Lanka et les Maldives.
Comme il s’agit d’un ensemble aussi immense que varié, nous allons le décrire groupe par groupe.

Les langues dardes

Les langues dardes, tout d’abord, sont parlées à l’est de l’Afghanistan, au nord du Pakistan et de l’Inde. Les principales langues dardes (ou dardiques) sont le cachemiri, le shina, le pashai et le khowar.

Le groupe nord-occidental

Les deux langues principales de ce groupe sont le sindhi et les langues lahnda. Elles sont parlées au Pakistan et au nord-ouest de l’Inde.

Le groupe septentrional ou pahari

Dans plusieurs de ces langues, le mot pahar signifie « montagne ». Il est donc facile de comprendre qu’elles sont parlées dans l’Himalaya. Il existe trois sous-groupes qui s’étendent d’ouest en est. A l’ouest est surtout parlé le dogri et à l’est, le népalais.

Le groupe occidental

La langue la plus importante de ce groupe est le pendjabi, parlé dans le Pendjab, qui se situe à cheval entre l’Inde et le Pakistan. Plus au sud sont parlés le rajasthani, le gujarati et le bhili.

Le groupe central

Nous attaquons un gros morceau puisque nous nous apprêtons à parler du hindi, première langue de l’Inde avec plus de 400 millions de locuteurs. L’ourdou est une variante du hindi qui s’écrit quant à lui avec l’alphabet arabe et s’est enrichi d’apports persans. Il est parlé en Inde et au Pakistan. Le hindi et l’ourdou étaient autrefois désignés comme une seule et même langue, l’hindoustani, mais l’opposition entre l’Inde hindouiste et le Pakistan musulman fait qu’ils sont souvent présentés comme deux langues à part. Lorsqu’il s’agit de langues et d’identité nationale, la politique n’est jamais bien loin.
Dans ce groupe central existent d’autres langues qui sont souvent considérées comme des variantes du hindi, comme le khariboli ou l’awadhi.

Le groupe oriental

Poursuivons notre voyage vers l’est avec le groupe oriental, lui-même décomposé en trois sous-groupes.
Le premier est le groupe bihari, qui comprend notamment le bhojpuri, le maithili et le magahi.
Le second est l’oriya, qui possède son propre système d’écriture, l’alphasyllabaire oriya.
Le troisième est le groupe assamais-bengali. L’assamais n’est autre que la langue indo-européenne la plus orientale actuellement parlée (si on exclut le russe). Le bengali, de son côté, est une langue extrêmement importante de l’Inde avec environ 200 millions de locuteurs et possède de nombreuses variantes dans sa région.

Le groupe méridional

Plus au sud sont parlés le marathi, dans la région du Maharashtra (autour de Bombay) et le konkani, sur la côte ouest de l’Inde.

Le groupe insulaire

Faisons un grand bond vers le sud, car les langues les plus méridionales de l’Inde, comme le tamoul ou le télougou, ne font pas partie du groupe indo-européen. Ce sont des langues dravidiennes.
Les langues qui nous intéressent ici sont le cingalais, parlé au Sri Lanka, et le maldivien, aux Maldives.

Langues nouristanies

Ces langues indo-iraniennes, parlées dans la province afghane du Nouristan et parfois appelées « dialectes kafir », sont classées dans une catégorie à part des langues indo-iraniennes. Elles ne sont donc ni des langues iraniennes, ni des langues indo-aryennes.

Je vous entends pousser un soupir de soulagement. J’espère que cet exposé sur les langues indo-iraniennes ne vous aura pas trop épuisé. Il n’était malheureusement pas possible de faire plus court car, en Inde, une langue même mineure peut vite représenter des millions, voire des dizaines de millions de locuteurs ! Il n’est donc pas envisageable de les survoler comme si de rien n’était.

Comparons les langues indo-européennes

Bien que toutes ces langues fassent partie de la même grande famille que le français, il faut bien se rendre compte qu’elles ont commencé à se différencier il y a plusieurs millénaires. Il est donc difficile, aujourd’hui, de comprendre quoi que ce soit au hindi ou à l’iranien sans connaissance préalable.
Pourtant, certains mots élémentaires ont pu conserver des sonorités proches et témoignent ainsi de la parenté qui existe entre les différentes langues indo-européennes. A partir de ces ressemblances, les linguistes ont reconstitué des racines indo-européennes, qui restent toutefois hypothétiques. Il est malheureusement impossible de reconstruire une langue dont il n’existe plus aucune trace.

Des mots étrangement similaires

Prenons par exemple le mot « mère », qui vient du latin mater. Sous cette forme, il est facile de le comparer à l’italien et l’espagnol madre, à l’allemand Mutter ou encore à l’anglais mother. Les ressemblances ne s’arrêtent pas là : en irlandais, « mère » se dit máthair et en grec ancien, mếtêr. Allons encore plus loin : māte en letton, matka en biélorusse. Vous voulez sortir des frontières européennes ? Soit. Nous avons donc mādar en persan, mātr̩ en sanskrit et même mācar dans l’une des variantes du tokharien.
Impressionnant, n’est-ce pas ? Ces ressemblances ont amené les linguistes à proposer la racine indo-européenne *méh₂tēr. Le petit astérisque indique qu’il s’agit d’un mot hypothétique. Si vous souhaitez découvrir plus de racines communes, je vous invite à consulter cet article Wikipédia.

Langues centum-satem

Finissons cet article avec un concept assez complexe, mais dont vous entendrez peut-être parler un jour : l’isoglosse centum-satem. En linguistique, une isoglosse est une limite séparant deux ensembles linguistiques. Je vous avais par exemple déjà parlé de la ligne La Spezia-Rimini en Italie.
Le mot indo-européen pour « cent » est *ḱm̥tóm. Il a donné centum en latin (le c se prononce comme un k) et satem en avestique (une ancienne langue iranienne). Je ne vais pas vous embêter avec des termes de linguistique complexe, mais on peut voir que les langues se distinguent nettement en deux groupes.

D’un côté le groupe centum: « cent » se dit hekatón en grec, cant en gallois, hundred en anglais et hundert en allemand (le k s’est transformé en h dans les langues germaniques).
De l’autre, le groupe satem: śatám en sanskrit, sto en russe, šim̃tas en lituanien.

Ce qui est fascinant avec cette séparation, c’est qu’on aurait vite fait de voir un clivage est-ouest, avec à l’est les langues satem (balto-slaves, indo-iraniennes…) et à l’ouest les langues centum (grec, langues germaniques et italo-celtiques…).
Sauf que les langues tokhariennes qui, souvenez-vous, ont existé à l’extrême est de l’espace indo-européen, sont centum ! En effet, « cent » se dit kante dans les deux variantes du tokharien. Comment est-ce possible ?
Il s’est en fait produit un processus de « satemisation », qui est parti d’une région située au nord de la mer Caspienne pour s’étendre simultanément vers l’ouest et vers l’est, où des langues indo-européennes se trouvaient déjà. Le tokharien, quant à lui, est resté isolé et n’a donc pas subi cette mutation.

Isoglosse centum-satem — Répartition des langues centum (en bleu) et satem (en rouge), avec le foyer supposé de la « satemisation » (en rouge foncé). Notez le tokharien, isolé à l’est.

Si je vous ai présenté ce phénomène, c’est pour vous montrer toute la complexité qui caractérise les langues indo-européennes et leur évolution depuis des temps immémoriaux.

Pour aller plus loin

Bien sûr, ce dossier ne fait qu’effleurer le sujet. On pourrait écrire des dizaines de volumes sur une famille de langues parlées par près de la moitié de la population mondiale.
Si vous souhaiter en savoir plus, Wikipédia constitue une bonne ressource, mais vous pouvez aussi consulter l’excellent site de l’université Laval de Québec. Sur Business Insider, vous trouverez également une sympathique carte animée montrant la propagation des langues indo-européennes, qui se base sur une origine anatolienne (turque). Enfin, si votre motivation n’a aucune limite, vous pouvez télécharger gratuitement ce livre, A Grammar of Modern Indo-European. Une version française est disponible, mais elle semble avoir été traduite avec Google Traductions. Un comble pour un livre traitant des langues…

J’espère en tout cas que ce dossier vous aura plu et vous aura permis de prendre toute la mesure de la richesse des langues indo-européennes. Si vous souhaitez apporter des précisions à cet article, n’hésitez surtout pas à écrire un commentaire.

Sources des images : l’image et les cartes illustrant cet article proviennent toutes de Wikipédia.

Pierre

Fondateur du Monde des Langues, j'aide les passionnés de langues à devenir plus autonomes et à atteindre leurs objectifs. J'ai eu l'occasion d'apprendre l'allemand, l'anglais, le finnois, l'italien et le japonais.

Ces articles vous intéresseront aussi

Pepito dit :

7 août 2017 à 20 h 10 min

Excellent exposé. Merci infiniment !

Reply
Sinthu-Santa dit :

18 novembre 2018 à 8 h 53 min

J’apprends bcp choses sur la langue du monde!!!
Merci mille fois 🙂

Reply
Thierry DOLIDON dit :

16 octobre 2019 à 9 h 23 min

Merci infiniment, c’est suprême !

Je vous suggère de corriger l’accord dans cette phrase :

Les langues tokhariennes ont toutes *disparues*

Reply
Marco dit :

13 avril 2021 à 19 h 36 min

Merci pour l'information présentée, Pour moi cela a été d'une grande aide. Ce texte est très instructif et très enrichissant.

Reply

A la découverte des langues indo-européennes

Les langues indo-européennes, qu’est-ce que c’est ?

Histoire d’une science : la linguistique comparée

Les origines des langues indo-européennes

Un peuple indo-européen ?

Une expansion en Europe et en Asie

Classification des langues indo-européennes

Branche italo-celtique

Branche germanique

Branche balto-balkanique

Branche helléno-phrygienne

L’arménien

Branche tokharienne

Branche anatolienne

Branche indo-iranienne

Langues iraniennes

Langues indo-aryennes

Les langues dardes

Le groupe nord-occidental

Le groupe septentrional ou pahari

Le groupe occidental

Le groupe central

Le groupe oriental

Le groupe méridional

Le groupe insulaire

Langues nouristanies

Comparons les langues indo-européennes

Des mots étrangement similaires

Langues centum-satem

Pour aller plus loin

Pierre

Le dossier de Noël : origines et évolutions d’une fête

Le CECR : l’échelle universelle pour atteindre vos objectifs en langues

CHOC CULTUREL : êtes-vous plutôt pêche 🍑 ou noix de coco 🥥 ?

Les langues les plus étonnantes d’Europe

Réseaux sociaux

Catégories

Rejoignez mes contacts pour recevoir les nouveaux articles dès leur parution

+ la formation gratuite "25 techniques pour apprendre votre vocabulaire"