fbpx

Le MIT a inventé une IA qui déchiffre seule les langues anciennes

par   Sarah Ben Bouzid   | 22 octobre 2020

Les cher­cheurs du labo­ra­toire d’in­for­ma­tique et d’in­tel­li­gence arti­fi­cielle du MIT (CSAIL) ont annoncé le 21 octobre avoir créé une IA capable de déchif­frer seule des langues perdues, en remon­tant le fil de ses langues descen­dantes.

L’IA est ainsi capable de caté­go­ri­ser les mots d’une langue ancienne et de faire le lien avec les équi­va­lents d’autres langues appa­ren­tées. Dirigé par la Pr Regina Barzi­lay du MIT, le système se base notam­ment sur le fait que les langues n’évo­luent jamais de manière tota­le­ment impré­vi­sibles.

Par exemple, alors qu’une langue donnée ajoute ou supprime rare­ment un son entier, certaines substi­tu­tions sonores peuvent s’être produites. Un mot avec un « p » dans la langue parente peut se trans­for­mer en un « b » dans la langue descen­dante, mais il est moins probable qu’il se trans­forme en un « k » en raison de l’écart impor­tant de pronon­cia­tion.

Ainsi, en prenant en compte le cadre des acci­dents linguis­tiques suscep­tibles de se produire lorsqu’une langue évolue, le modèle peut segmen­ter les mots d’une langue ancienne et les mettre en corres­pon­dance avec les équi­va­lents d’une langue appa­ren­tée. Ce faisant, les cher­cheurs ont par exemple confirmé le fait que la langue ibère n’était pas appa­ren­tée au basque, comme certains le prétendent.

En d’autres termes, cet « algo­rithme de déchif­fre­ment » va iden­ti­fier les racines des langues anciennes pour tenter de les déchif­frer. Dans ses futurs travaux, l’équipe espère étendre son IA au-delà du « déchif­fre­ment basé sur les paren­tés », car cette méthode suppose qu’une telle langue connue existe, or l’exemple de l’ibère montre que ce n’est pas toujours le cas.

Source : MIT News

Plus de turfu