Научить машины по-настоящему понимать естественный язык - одна из самых больших проблем, с которыми сталкиваются компьютерные ученые, работающие над развитием искусственного интеллекта. Но Google добился реального прогресса в том, чтобы заставить компьютеры рассматривать язык как нечто большее, чем просто набор слов, и эти достижения теперь находят свое отражение в его продуктах.
Google Translate, например, подвергается техническому обновлению с появлением нейронного машинного перевода (NMT). Начиная с сегодняшнего дня, вы заметите значительные улучшения в любых переводах на хинди, русский и вьетнамский. Это следует за первой попыткой использования NMT в Translate в ноябре прошлого года, когда в английском, французском, немецком, испанском, португальском, китайском, японском, корейском и турецком языках произошло такое же улучшение.
В целом у нас 103 языка, и наша цель - заставить все они работать с нейронными сетями, - сказал Braganca представитель Google. Он добавил, что внедрение остальных языков будет происходить в течение многих месяцев, но точные сроки неизвестны, потому что Google просто запускает каждый из них, когда он в состоянии превзойти текущую систему. Иногда их будет несколько сразу, как, например, с сегодняшним введением улучшенного хинди, русского и вьетнамского языков.
Google Translate всегда был полезным, но в целом. Вы можете использовать его, чтобы понять, что что-то означает на другом языке, но что-то большее, чем простая фраза, не будет точным переводом. Но с этим новым подходом переводы в Google Search, translate.google.com, приложениях Google и, в конечном итоге, автоматический перевод страниц в Chrome будут значительно лучше и, наконец, будут отражать естественный язык.
Нейронный перевод намного лучше, чем наша предыдущая технология, потому что мы переводим целые предложения за раз, а не части предложения, - написал Барак Туровский, руководитель продукта в Google Translate, в сообщении в блоге, анонсирующем эту новость.
Раньше Google полагался на машинный перевод на основе фраз (PBMT), который разбивает введенное предложение на слова и фразы для независимого перевода. Однако новый NMT рассматривает все предложение как ввод и переводит его как одно целое. NMT использует глубокие нейронные сети, которые позволяют компьютеру понимать ситуации, которых он раньше не видел, обучаясь сверхурочно на основе другой информации. В этом случае некоторые из обучающих наборов, которые программа использует для обучения, являются данными из Сообщество Google Translate , где обычные пользователи со всего мира переводят предложения со своих языков и даже оценивают переводы.
Хотя все языки не будут переведены в течение многих месяцев, следующая партия ожидается через несколько недель.