Google улучшила перевод с помощью нейросетей

Компания Гугл наращивает мощь, ежедневно удивляя все больше. Совсем сравнительно не так давно мы писали о совершенствовании фирменного синтезатора речи посредством перехода с совокупности компилятивного синтеза на сверточную нейросеть. А уже пару дней назад в официальном блоге компании показалась запись об улучшенной совокупности перевода, благодаря задействованию… нейросетей.

Десять лет назад Гугл заявила о запуске Гугл Translate, трудящегося по принципу статистического машинного перевода, где итог генерируется на базе статистических моделей (по словам, фразам, иерархическим фразам и синтаксису). Их параметры являются образованием от анализа параллельных корпусов текста (его перевод и текст оригинала). Несложными словами, это статистический машинный перевод, представленный в виде программы, которая разбирает громадной массив дешёвых данных.

К примеру, словари либо другие переведенные человеком документы, где имеется перевод и оригинал. По окончании совокупность делает выборку, переводит словарь и грамматику одного языка на другой и образовывает готовые предложения.

Главными проблемами статистического машинного перевода (SMT) являются бессчётные грамматические неточности, и нестабильность перевода.

На этой неделе компания заявила о переходе на рекуррентную нейронную сеть (Machine Translation Neura), которая существенно отличается от машинного перевода, чья совокупность складывается из многих подкомпонентов, оптимизированных любой по отдельности. GMTN, со своей стороны, основана на правилах глубинного обучения.

Конечный ответ зависит от прошлого состояния сети, а не только поступающих на вход данных. Таковой принцип действия чем-то напоминает человеческий, разрешая совокупности ориентироваться благодаря взятому опыту.

Google улучшила перевод с помощью нейросетей

Рекуррентные нейросети содержат в себе обратную сообщение разрешающую передавать эти для постепенного исполнения.

GMNT выстроена на особенном виде PHC (рекуррентная нейросеть), именуемой LSTM-сетью и складывающейся из двух восьмислойных нейросетей: разбирающей и синтезирующей. Иными словами, энкодера и декодера, между которыми установлен модуль внимания. Энкодер разбирает уникальное предложение (слева направо и в обратном направлении), передавая обработанную данные декодеру, что на базе взятого состояния образовывает перевод.

Модуль внимания корректирует работу совокупности и ориентирован на выявление и поиск главных моментов. К примеру, фразеологизмов.

Изображенные боксы отражают состояние вектора в слое.

Для оценки эффективности совокупности отобрали много материалов, каковые позднее протестировали посредством NMTS, SMT, и живых переводчиков. Исходя из данных взятых посредством дополнительных оценок и опросов экспертов, точность перевода новой совокупности существенно выше, чем у существующих аналогов. Но, пока не дотягивает до людской результата.

Сейчас совокупность ограничивается несколькими языками, среди которых английский язык , китайский, французский и испанский. Все три трудятся лишь в связке с британским. отличных показателей, в сравнение с предшествующими совокупностями перевода Гугл, демонстрирует пара испанского и британского. Уровень качества перевода (по оценке людей) выросло на 60-87% довольно людской результата.

По шкале от нуля до шести языковая пара британский-испанский взяла оценку — 5,428 балла, перевод посредством Гугл Translate получил 4,885 балла, а итог опытных переводчиков оценили в 5,550 баллов.

Связка британский-китайский известна собственной грамматической сложностью. Не обращая внимания на большое уменьшение количества неточностей, уровень качества перевода в данной языковой паре значительно уступает переводу индоевропейских языков.

Следующая визуализация демонстрирует прогрессирование GNMT и перевод китайского предложение на английский. Больше примеров вы сможете отыскать тут.

Разработчики уже запустили совокупность на мобильном приложении, но пока только для англо-китайской версии. В течении нескольких месяцев планируется добавить другие языковые пары.

Если вы нашли неточность, прошу вас, выделите фрагмент текста и надавите Ctrl+Enter.

Увлекательные записи:

Google Translate осваивает нейросети. Новая технология для языковых переводов


Комментарии и уведомления в настоящее время закрыты..

Комментарии закрыты.