Яндекс создал "гибрид" искусственного интеллекта для перевода текстов
Опубликованно 17.09.2017 16:01
МОСКВА, 14 Сен — РИА Новости. Эксперты компании "яндекс" разрабатывает новую систему онлайн-перевода, которые одновременно используются и старые статистические алгоритмы и искусственный интеллект, сообщает пресс-служба компании.
"Во время нашей новой системы только перевод с английского на русский язык поддерживает. В ближайшее время мы начнем добавлять другие языковые пары и в течение нескольких месяцев реализовать поддержку большинства популярных языков", — пояснили в пресс-службе "Яндекса", отвечая на вопросы корреспондента РИА Новости.
В последние годы ведущие IT-компании начали активно развивать и использовать различные формы искусственного интеллекта для поиска информации в сети, редактирование фотографий и их каталогизации и многих других целей, где не классические алгоритмы обработки данных не работают.
Ярким примером такого подхода является система искусственного интеллекта AlphaGo, открыто обыгравшая чемпионов мира и Европы по. и анонимно выигравшего сотни топ-игроков в онлайн-системах этой древней китайской игры.
Большинство из этих явлений основывается на так называемой глубины или сверточных нейросетях. Они представляют собой каскады-или многослойных структур из нескольких десятков или сотен более простых нейросетей. Каждый из них обрабатывает не исходные данные, а продукты анализа, которые в сети выше), что позволяет упростить очень сложные проблемы и решать их с помощью сравнительно скромные вычислительные мощности.
Нечто подобное происходит при использовании искусственного интеллекта для перевода с одного языка на другой. Если нейросеть "читает" переводимый текст, он не пытается переводить, через фразы или отдельные слова, но и находит общий ответ с данными, при анализе текстов, переведенных человеком.
При подобном подходе, как отмечают специалисты "Яндекса", есть как и минусы: в таком виде текст будет более читабельным и подобно тому, как человек бы перевел, но с другой стороны, машина периодически начинает "мечтать", если есть некоторые редкие слова и фразы.
Эта проблема "Яндекса" решило сочетание искусственного интеллекта со старой системой переводов, хорошо справлявшейся с редкими словами, но сталкивавшейся с большими проблемами при их объединении в предложении. Когда пользователь вводит текст, переводит его и нейросеть, и статистический алгоритм, после чего система машинного обучения CatBoost, вновь созданный "Яндексом", сравнивает результаты и собирает из них четкий и грамотный вариант.
Сейчас старую версию "яндекс.Переводчик" 94 поддерживаемых языков, включая ряд редких и художественных фильмов, например, синдарин — язык эльфов из книг Дж. Р. Р. Толкиен.
Категория: Технологии