Les langues indo-européennes sont une famille de langues apparentées qui sont aujourd'hui largement parlées en Amérique, en Europe, mais aussi dans l’ouest et le sud de l’Asie. De même que des langues comme l'espagnol, le français, le portugais et l'italien descendent toutes du latin, les langues indo-européennes dériveraient d'une langue hypothétique appelée proto-indo-européenne, qui n'est plus parlée.
Il est fort probable que les premiers locuteurs de cette langue vivaient à l'origine autour de l'Ukraine et des régions voisines du Caucase et de la Russie méridionale, puis ils se sont répandus dans la majeure partie du reste de l'Europe et plus tard en Inde. La fin la plus précoce possible de l'unité linguistique proto-indo-européenne se situerait autour de 3400 av. JC.
Comme les locuteurs de la langue proto-indo-européenne n'ont pas développé de système d'écriture, nous n'en avons aucune preuve physique. La science de la linguistique a essayé de reconstruire cette langue en utilisant plusieurs méthodes et, bien qu'une reconstruction précise semble impossible, nous avons aujourd'hui une image générale de ce que les locuteurs proto-indo-européens avaient en commun, tant sur le plan linguistique que culturel. Outre l'utilisation de méthodes comparatives, il existe des études fondées sur la comparaison des mythes, des lois et des institutions sociales.
Les branches des langues indo-européennes
Les langues indo-européennes ont un grand nombre de branches : l'anatolien, l'indo-iranien, le grec, l'italique, le celtique, le germanique, l'arménien, le tocharien, le balto-slave et l'albanais.
Anatolien
Cette branche des langues était prédominante dans la partie asiatique de la Turquie et dans certaines régions du nord de la Syrie. La plus célèbre de ces langues est le hittite. En 1906, un grand nombre de découvertes hittites ont été faites sur le site de Hattusas, la capitale du royaume hittite, où environ 10 000 tablettes cunéiformes et divers autres fragments ont été trouvés dans les vestiges d'une archive royale. Ces textes datent du milieu ou de la fin du deuxième millénaire av. JC. Le luvien, le palaïque, le lycien et le lydien sont d'autres exemples de familles appartenant à ce groupe.
Toutes les langues de cette branche sont actuellement éteintes. C'est dans cette branche que l'on trouve la plus ancienne trace d'une langue indo-européenne, datée d'environ 1800 av. JC.
Indo-Iranien
Cette branche comprend deux sous-branches: l'indien et l'iranien. Ces langues sont aujourd'hui prédominantes en Inde, au Pakistan, en Iran et dans ses environs, ainsi que dans des régions allant de la mer Noire à la Chine occidentale.
Le sanskrit, qui appartient à la sous-branche indienne, est la plus connue des langues anciennes de cette branche ; sa variété la plus ancienne, le sanskrit védique, est conservée dans les Vedas, un recueil d'hymnes et d'autres textes religieux de l'Inde ancienne. Les locuteurs indiens ont pénétré dans le sous-continent indien, en provenance d'Asie centrale, vers 1500 av. JC : Dans le Rig-Veda, l'hymne 1.131 parle d'un voyage légendaire qui peut être considéré comme un lointain souvenir de cette migration.
L'avestique est une langue qui fait partie du groupe iranien. Le vieil avestique (parfois appelé gāthique) est la plus ancienne langue préservée de la sous-branche iranienne, la « sœur » du sanskrit, qui est la langue utilisée dans les premiers textes religieux zoroastriens. Une autre langue importante de la sous-branche iranienne est le vieux persan, que l'on retrouve dans les inscriptions royales de la dynastie achéménide, à partir de la fin du 6e siècle av. JC. La plus ancienne preuve datable de cette branche remonte à environ 1300 av. JC.
Aujourd'hui, de nombreuses langues indiennes sont parlées en Inde et au Pakistan, comme l'hindi-urdu, le punjabi et le bengali. Les langues iraniennes telles que le farsi (persan moderne), le pachto et le kurde sont parlées en Irak, en Iran, en Afghanistan et au Tadjikistan.
Grec
Plutôt qu'une branche des langues, le grec est un groupe de dialectes : Pendant plus de 3000 ans d'histoire écrite, les dialectes grecs n'ont jamais évolué vers des langues mutuellement incompréhensibles. Le grec était prédominant à l'extrémité sud des Balkans, dans la péninsule du Péloponnèse, ainsi que dans la mer Égée et ses environs. La plus ancienne trace écrite d'une langue grecque est le mycénien, le dialecte de la civilisation mycénienne, que l'on trouve principalement sur des tablettes d'argile et des récipients en céramique en Crète. Le mycénien ne possédait pas de système d'écriture alphabétique, mais plutôt une écriture syllabique connue sous le nom d'écriture linéaire B.
Les premières inscriptions alphabétiques ont été datées du début du 8e siècle av. JC, ce qui correspond probablement à l'époque où les épopées homériques, l'Iliade et l'Odyssée, ont atteint leur forme actuelle. Il existait de nombreux dialectes grecs dans l'Antiquité, mais en raison de la suprématie culturelle d'Athènes au 5e siècle av. JC, c'est le dialecte d'Athènes, appelé attique, qui est devenu la langue littéraire standard pendant la période classique (480-323 av. JC). Par conséquent, les poésies et les proses grecques les plus célèbres de l'époque classique ont été écrites en attique : Aristophane, Aristote, Euripide et Platon ne sont que quelques exemples d'auteurs qui ont écrit en attique.
Italique
Cette branche était prédominante dans la péninsule italienne. Les Italiens n'étaient pas natifs de l'Italie ; ils y sont entrés en traversant les Alpes vers 1000 av. JC et ils se sont progressivement déplacés vers le sud. Le latin, la langue la plus célèbre de ce groupe, était à l'origine une langue locale relativement peu répandue, parlée par des tribus pastorales vivant dans de petits établissements agricoles au centre de la péninsule italienne. Les premières inscriptions en latin sont apparues au 7e siècle av. JC, et à partir du 6e siècle av. JC la langue s'était considérablement répandue.
Rome est à l'origine de la croissance du latin dans l'Antiquité. Le latin classique est la forme de latin utilisée par les œuvres les plus célèbres d'auteurs romains comme Ovide, Cicéron, Sénèque, Pline et Marc-Aurèle. Les autres langues de cette branche sont : Le falisque, le sabéllique, l'ombrien, le picènien du sud et l'osque, toutes éteintes.
Aujourd'hui, les langues romanes sont les seuls descendants survivants de la branche italique.
Celtique
Cette branche contient deux sous-branches : le celtique continental et le celtique insulaire. Vers 600 av. JC, les tribus de langue celtique s'étaient répandues à partir de ce qui est aujourd'hui le sud de l'Allemagne, l'Autriche et l'ouest de la République tchèque dans presque toutes les directions, jusqu'en France, en Belgique, en Espagne et dans les îles britanniques, puis vers 400 av. JC, elles se sont également déplacées vers le sud en Italie du Nord et vers le sud-est dans les Balkans et même au-delà. Au début du 1er siècle av. JC, les tribus de langue celtique dominaient une partie très importante de l'Europe. En 50 av. JC, Jules César a conquis la Gaule et la Grande-Bretagne a également été conquise environ un siècle plus tard par l'empereur Claude. En conséquence, cette vaste zone de langue celtique a été absorbée par Rome, le latin est devenu la langue dominante et les langues celtiques continentales ont fini par disparaître. La principale langue continentale était le gaulois.
Le celtique insulaire s'est développé dans les îles britanniques après l'arrivée de tribus de langue celtique aux alentours du 6e siècle av. JC. En Irlande, le celtique insulaire a prospéré, grâce à l'isolement géographique qui a préservé l'Irlande des invasions romaines et anglo-saxonnes.
Les seules langues celtiques encore parlées aujourd'hui (le gaélique irlandais, le gaélique écossais, le gallois et le breton) sont toutes issues du celtique insulaire.
Germanique
La branche germanique est divisée en trois sous-branches: Le germanique oriental, actuellement éteint ; le germanique septentrional, qui contient le vieux norrois, l'ancêtre de toutes les langues scandinaves modernes ; et le germanique occidental, qui contient le vieil anglais, le vieux saxon et le vieux haut allemand.
Les premières preuves de l'existence de peuples germanophones remontent à la première moitié du 1er millénaire av. JC. Ils vivaient dans une région qui s'étendait du sud de la Scandinavie à la côte de la mer Baltique du Nord. Au cours de la préhistoire, les tribus germanophones sont entrées en contact avec des tribus de langue finnique au nord et avec des tribus balto-slaves à l'est. En raison de cette interaction, la langue germanique a emprunté plusieurs termes au finnois et au balto-slave.
Plusieurs variétés de vieux norrois étaient parlées par la plupart des Vikings. La mythologie et le folklore nordiques pré-chrétiens germaniques ont également été préservés en vieux norrois, dans un dialecte appelé vieil islandais.
Le néerlandais, l'anglais, le frison et le yiddish sont des exemples de survivants modernes de la sous-branche ouest-germanique, tandis que le danois, le féroïen, l'islandais, le norvégien et le suédois sont des survivants de la branche nord-germanique.
Arménien
L'origine du peuple de langue arménienne est un sujet encore non résolu. Il est probable que les Arméniens et les Phrygiens aient appartenu à la même vague migratoire qui a pénétré en Anatolie, en provenance des Balkans, vers la fin du 2e millénaire av. JC. Les Arméniens se sont installés dans une région située autour du lac de Van, actuellement en Turquie; cette région appartenait à l'État d'Urartu au début du 1er millénaire av. JC. Au 8e siècle av. JC, Urartu est passé sous le contrôle des Assyriens et au 7e siècle av. JC, les Arméniens ont repris la région. Les Mèdes ont absorbé la région peu après et l'Arménie est devenue un État vassal. À l'époque de l'empire achéménide, la région est devenue une satrapie perse. La domination perse a eu un fort impact linguistique sur l'arménien, ce qui a induit en erreur de nombreux chercheurs dans le passé, qui ont cru que l'arménien appartenait en fait au groupe iranien.
Tocharien
L'histoire du peuple de langue tocharienne est encore entourée de mystère. On sait qu'ils vivaient dans le désert du Taklamakan, situé dans l'ouest de la Chine. La plupart des textes en tocharien qui nous restent sont des traductions d'œuvres bouddhiques connues, et tous ces textes ont été datés entre le 6e et le 8e siècle ap. JC. Aucun de ces textes ne parle des Tochariens eux-mêmes. Deux langues différentes appartiennent à cette branche : Le tocharien A et le tocharien B. Les vestiges du tocharien A n'ont été trouvés qu'à des endroits où des documents en tocharien B ont également été trouvés, ce qui suggère que le tocharien A était déjà éteint et n'était maintenu en vie que comme langue religieuse ou poétique, tandis que le tocharien B était la langue vivante utilisée à des fins administratives.
De nombreuses momies bien conservées, présentant des caractéristiques caucasoïdes telles qu'une grande taille et des cheveux roux, blonds et bruns, ont été découvertes dans le désert du Taklamakan, datant de 1800 av. JC à 200 ap. JC. Le style de tissage et les motifs de leurs vêtements sont similaires à ceux de la culture de Hallstatt en Europe centrale. Des analyses physiques et des preuves génétiques ont révélé des ressemblances avec les habitants de l'Eurasie occidentale.
Cette branche est complètement éteinte. Parmi toutes les langues indo-européennes anciennes, le tokarien était parlé le plus à l'est.
Balto-slave
Cette branche contient deux sous-branches: le balte et le slave.
À la fin de l'âge du bronze, le territoire des Baltes s'étendait peut-être des environs de la Pologne occidentale jusqu'aux montagnes de l'Oural. Par la suite, les Baltes ont occupé une petite région le long de la mer Baltique. Les habitants de la partie nord du territoire occupé par les Baltes étaient en contact étroit avec les tribus finniques, dont la langue ne faisait pas partie de la famille des langues indo-européennes : Les locuteurs finniques ont emprunté une quantité considérable de mots baltes, ce qui suggère que les Baltes avaient un prestige culturel important dans cette région. Sous la pression des migrations gothiques et slaves, le territoire des Baltes s'est réduit vers le 5e siècle ap. JC.
Des preuves archéologiques montrent qu'à partir de 1500 av. JC, les Slaves ou leurs ancêtres occupaient une zone s'étendant des frontières occidentales de la Pologne jusqu'au fleuve Dniepr en Biélorussie. Au cours du 6e siècle ap. JC, les tribus slavophones ont étendu leur territoire, migrant vers la Grèce et les Balkans : c'est à ce moment-là qu'elles sont mentionnées pour la première fois, dans des documents byzantins faisant référence à cette grande migration. Une partie ou la totalité des Slaves étaient autrefois situés plus à l'est, en territoire iranien ou aux alentours, puisque le pré-slave a emprunté de nombreux mots iraniens à un stade précoce. Plus tard, en se déplaçant vers l'ouest, ils sont entrés en contact avec des tribus allemandes et ils ont à nouveau emprunté plusieurs termes supplémentaires.
Seules deux langues baltes survivent aujourd'hui : Le letton et le lituanien. Un grand nombre de langues slaves survivent aujourd'hui, comme le bulgare, le tchèque, le croate, le polonais, le serbe, le slovaque, le russe et bien d'autres encore.
Albanais
L'albanais est la dernière branche des langues indo-européennes à apparaître sous forme écrite. Il existe deux hypothèses sur l'origine de l'albanais. La première dit que l'albanais est un descendant moderne de l'illyrien, une langue qui était largement parlée dans la région à l'époque classique. Comme nous savons très peu de choses sur l'illyrien, cette affirmation ne peut être ni réfutée ni confirmée d'un point de vue linguistique. En revanche, d'un point de vue historique et géographique, cette affirmation a du sens. Une autre hypothèse veut que l'albanais soit un descendant du thrace, une autre langue perdue qui était parlée plus à l'est que l'illyrien.
Aujourd'hui, l'albanais est parlé en Albanie en tant que langue officielle, dans plusieurs autres régions de l'ex-Yougoslavie et également dans de petites enclaves dans le sud de l'Italie, en Grèce et en République de Macédoine.
Langues non affiliées
Toutes les langues de ce groupe sont soit éteintes, soit un ancien stade d'une langue moderne. Des exemples de ce groupe de langues sont le phrygien, le thrace, l'ancien macédonien (à ne pas confondre avec le macédonien, une langue actuellement parlée en République de Macédoine, qui fait partie de la branche slave), l'illyrien, le vénitien, le messapique et le lusitanien.
Linguistique historique indo-européenne
Dans les temps anciens, on a remarqué que certaines langues présentaient des similitudes frappantes : Le grec et le latin en sont un exemple bien connu. Dans l'Antiquité classique, on a remarqué, par exemple, que le grec héks «six» et heptá «sept» étaient similaires au latin sex et septem. En outre, la correspondance régulière entre l'initiale h- en grec et l'initiale s- en latin a été mise en évidence.
L'explication que les anciens ont trouvée est que la langue latine était un descendant de la langue grecque. Des siècles plus tard, pendant et après la Renaissance, les similitudes étroites entre d'autres langues ont également été notées, et l'on a compris que certains groupes de langues étaient apparentés, comme l'islandais et l'anglais, ainsi que les langues romanes. Malgré toutes ces observations, la science de la linguistique ne s'est pas beaucoup développée avant le 18e siècle.
Au cours de l'expansion coloniale britannique en Inde, un orientaliste et juriste britannique nommé Sir William Jones s'est familiarisé avec la langue sanskrite. Jones connaissait également le grec et le latin et il fut surpris par les similitudes entre ces trois langues. Lors d'une conférence donnée le 2 février 1786, Sir William Jones a exprimé ses nouvelles idées :
La langue sanskrite, quelle que soit son ancienneté, est d'une structure merveilleuse ; plus parfaite que le grec, plus copieuse que le latin, et plus exquisément raffinée que l'une ou l'autre. Mais elle présente une affinité très forte avec ces deux autres langues, tant dans les racines des verbes que dans les formes de la grammaire, cela n’aurait pas pu être produit par accident. C’est si fort en effet, qu’aucun philologue ne pourrait examiner les trois langues, sans croire qu’elles aient jailli d’une source commune, qui, peut-être, n’existe plus. Il y a une raison similaire, bien que moins convaincante, pour supposer que le gothique et le celtique, bien que mélangés avec un idiome très différent, ont eu la même origine que le sanskrit ; et le vieux persan pourrait être ajouté à la même famille, si c'était le lieu pour discuter de toute question concernant l'antiquité de la Perse. (Fortson, p. 9)
L'idée que le grec, le latin, le sanskrit et le persan étaient dérivés d'une source commune était révolutionnaire à cette époque. C'était un tournant dans l'histoire de la linguistique. Plutôt que la «fille» du grec, le latin était pour la première fois compris comme la «sœur» du grec. En se familiarisant avec le sanskrit, une langue géographiquement très éloignée du grec et du latin, et en réalisant que le hasard n'était pas une explication suffisante des similitudes entre ces langues, Sir William Jones a présenté une nouvelle vision qui a déclenché le développement de la linguistique moderne.