Разработана программа для автоматической реконструкции протоязыков

Ученые разработали алгоритм, который позволяет на основе лексических данных автоматически реконструировать слова из протоязыков. На первом этапе программа автоматически распознает однокоренные слова, а затем пытается восстановить их в той форме, в какой они присутствовали в протоязыке.

При этом она основывается на некоторых правилах, управляющих сохранением и изменением отдельных звуков в словах. Модель эволюции, создаваемая программой, имеет вероятностный характер и разные ее элементы могут иметь большую или меньшую статистическую значимость.

В качестве теста нового алгоритма ученые построили древо происхождения австронезийских языков. Эти языки преимущественно распространены на территории Тихого океана, но к западу встречаются вплоть до Мадагаскара. Около 300 миллионов человек говорят на этих языках.

Программа проанализировала более 140 тысяч слов в 637 языках этой семьи, построило дерево их происхождения и восстановило лексику нескольких протоязыков в основании этого дерева. По словам авторов, при сравнении полученных результатов с данными лингвистов их точность составила около 85%.

Специалисты, опрошенные NatureNews, считают такую точность хорошей для облегчения работы лингвистов, однако все равно рассматривают модели, составляемые программой, только в качестве приблизительных.

Миграция носителей австронезийских языков началась с территории Тайваня около 3 тысяч лет до нашей эры.
Christophe Cagé/Maulucioni

Следите за обновлениями сайта в нашем Telegram-канале