Блог Яндекса

Сервис "Яндекс.Переводчик" пополнил свой функционал - теперь он способен переводить слова и фразы на различных языках в эмодзи и обратно. Сообщение об этом было опубликовано в блоге "Яндекса".

"В каком-то смысле эмодзи - отдельный язык с пиктографическим письмом, как у древних шумеров. Теперь этим языком владеет и "Яндекс.Переводчик". Введите в "Переводчик" отдельное слово, словосочетание или целую фразу, и он представит их в виде эмодзи. Или наоборот: можно перевести на русский набор картинок, который вам прислали в чат, - возможно, при этом откроется новый смысл послания", - говорится в сообщении.

Обычно переводчик учит языки путем анализа параллельных текстов, однако этот метод не подходит для освоения эмодзи, поскольку пока что существует немного "текстов" на эмодзи и их оригиналов на других языках. Поэтому в данном случае переводчик "Яндекса" использует данные сетевых словарей, в которых собраны эмодзи и их толкования.

Поскольку в настоящее время число эмодзи идет на тысячи, подобрать прямое соответствие в словарях можно далеко не для всех слов, поэтому переводчик научился понимать смысл пиктограмм. Например, слово "квас" он заменит изображением бокала с напитком.

"Когда вы хотите перевести на эмодзи ту или иную фразу, переводчик разбивает ее на отдельные элементы: слова и комбинации слов. Каждый элемент представляется в виде вектора - иными словами, записывается в виде набора чисел. Аналогичная операция проводится и с описаниями эмодзи. Затем векторы сопоставляются. Чем ближе друг к другу находятся векторные представления, тем точнее смысловое соответствие между словами и эмодзи", - отмечается в сообщении.

Переводить слова и предложения на эмодзи и обратно "Яндекс.Переводчик" может с любого из доступных ему 94 языков. Опробовать возможности этого перевода можно как в веб-версии сервиса, так и в приложениях для iOS и Android.

Напомним, в сентябре разработчики внедрили в "Яндекс.Переводчик" гибридную систему перевода, использующую как привычный статистический метод перевода, так и нейросети.