Лингвистический анализ ТАНАХа
Места, в которых программа разошлась с учёными, представляют, конечно, наибольший интерес. Например, первая глава Бытия считается «священнической», но компьютер не нашел этому подтверждения. Предполагается, что книга Исайи написана двумя авторами, причём второй принимает эстафету в 39-й главе. Компьютер "согласился" с гипотезой о двух авторах, но увидел руку второго уже в гл. 33.
Машина справилась и с более сложной задачей: учёные перемешали текст из книг Иезекииля и Иеремии, и компьютер почти идеально разобрался в головоломке.
В основе компьютерной программы — распознавание повторяющихся наборов слов и синонимов. Например, один библейский автор называет посох «makel», а другой — «mateh».
Это не первое достижение доктора Коппеля. В 2003 году он принимал участие в разработке программы, которое в четырёх случаях из пяти угадала половую принадлежность автора текста: выяснилось, что женщины предпочитают говорить о людях, а мужчины — о вещах.
Результаты исследования были представлены на конференции Ассоциации по вычислительной лингвистике.
Дмитрий Целиков
science.compulenta.ru/