Чтобы машинный перевод был хорош, система должна тренироваться, и чем больше, тем лучше. Лучше всего он работает, когда есть много текстов для переработки. Но компьютер никогда полностью не заменит живого переводчика.Многие пользователи интернета пользуются машинным переводом вроде «Гугл Транслейт» (Google Translate) или «Бинг» (Bing). Такие службы могут помочь более чем с сотней языков и постоянно развиваются. В прошлом году «Гугл» представил пару наушников для синхронного перевода.
Но насколько хороши на самом деле машинные переводы? Порой они все-таки оказываются довольно непонятными.
В первую очередь все зависит от того, о каком языке идет речь, и была ли у системы возможность как следует «потренироваться» с данной парой языков. Повторение — мать учения, это правило работает и для компьютера. Чтобы развиваться, системе нужны уже готовые переводы, сделанные человеком.
«Путем автоматического сравнения оригинальных текстов и переводов можно провести параллели между языками, предложение за предложением и слово за словом, чтобы определить возможные связи. Появляется статистика вероятных соотношений, то есть возможных соответствий слов, фраз и предложений», — говорит Анна Согвалль Хейн (Anna Sågvall Hein), заслуженный профессор компьютерной лингвистики Уппсальского университета.
Чем больше текстов можно «скормить» машине, тем лучше. И когда речь идет о крупных западных языках вроде английского, французского, испанского и немецкого, то запас текстов и переводов, к которым можно прибегнуть, велик. Благодаря этому у системы есть много материала для того, чтобы вычислить, какие слова друг другу соответствуют.
«Важно также, чтобы переводы, которые даются на анализ, были хорошего качества», — говорит Анна Согвалль Хейн. Машинные переводы шведского языка работают все лучше, считает она, — в последние годы прогресс в этой области хороший. Гораздо труднее с малыми языками, такими, например, как саамский и курдский.
«Для того, чтобы обучать систему, тут недостаточно данных. Поэтому результат получается далеким от совершенства».
Также непростую задачу представляют собой языки со сложной морфологией, то есть такие, где слова склоняются и изменяются согласно своей грамматической функции. Примеры таких языков — греческий, португальский и финский. Для компьютера предложение — это всего лишь строчка символов, и финский с его 15 падежами вызывает затруднения.
«Лучше всего машинный перевод работает с текстами практического назначения в рамках ограниченной тематики», — говорит Анна Согвалль Хейн.
Сама она следит за развитием этой сферы с 1960-х годов, когда она оказалась в числе первых студентов, изучающих компьютерную обработку данных в Уппсальском университете. Она интересовалась языками и компьютерами, поэтому машинный перевод и стал полем ее профессиональной деятельности. Сегодня она руководит предприятием, занимающимся языковыми технологиями, которое, например, переводят учебные планы и правительственную информацию на английский, арабский и персидский. Мы встретились в ее офисе, или «лаборатории», как она это называет, в Уппсале. Она подчеркивает, что машина никогда полностью не заменит живого переводчика. Особенно в том, что касается перевода литературных текстов.
«Литературный перевод — это творческий процесс. Он требует и совершенно других знаний,, а также подразумевает способность читать между строк. Машина же лишь совершает механическую перекодировку, а это совсем другое».
Материалы ИноСМИ содержат оценки исключительно зарубежных СМИ и не отражают позицию редакции ИноСМИ.
Лучшие
Показать новые комментарии (0)
Все комментарии

| 2 Машина никогда не сделает вменяемый перевод. Потому что для этого надо понять текст. Это и к людям относится. Раскрыть всю ветку (2 сообщений в ветке) 
| 0 monitor-spb, каждый понимает в меру своей испорчености (образованности). (с) 
| 0 monitor-spb, просто шикарно сформулировано! Жалко, что нельзя поставить больше одного плюса. 
| 1 Машина программируется человеком, и программа всегда будет отставать, потому что в языке в ходе развития общества появляются новые смыслы и оттенки смыслов, которые машина адекватно перевести не в состоянии, пока их не введут в программу. Раскрыть всю ветку (2 сообщений в ветке) 
| 0 trick, раз в действиях человека имеется логика, то и машина в состоянии проанализировать и приспособиться (правильно интерпретировать фразу или словоизменение). Не зря дети быстро схватывают языковые формы, учатся понимать без всяких учебников, а потом в школе их учат многочисленным исключениям из правил. 
| 0 Чтоб я так жил, во-первых, в действиях человека логика просматривается далеко не всегда, а во вторых, человек состоит из клеток, молекул, атомов и т.д., и эволюционирует вместе со всей вселенной, а наш разум и речь лишь фиксируют эти изменения после того, как они произошли. Именно поэтому машину невозможно запрограммировать наперёд, потому что наше будущее всегда неизвестно, и наша реакция на него тоже. 
| -1 Пары близких языков может и адекватно переводить. Типа русского и хохольского. Раскрыть всю ветку (2 сообщений в ветке) 
| 1 liova01, 
| 0 darksky, Пардон. клава сбоит. Вместо второго "О" дефис нужен. 
| 0 Перевод нуждается в семантическом переводе выражений, а не поиском иностранных синонимов слов. Как бы это ни звучало, а худежественное многословие и образность — от языковой бедности. Раскрыть всю ветку (1 сообщений в ветке) 
| 0 Чтоб я так жил, Технические тексты с сильно ограниченным вокабулярием и сейчас можно настроить переводчик. 
| 1 Язык - это не точная наука. Существуют омонимы, синонимы, многозначные слова, коннотации, оттенки смысла и его величество Контекст, от которого в переводе зависит буквально ВСЁ. Ни одна, пусть даже самая совершенная программа никогда не сможет учесть все тонкости, которые (даже не всегда осознанно) учитывает человеческий мозг при переводе с одного языка на другой. Программы перевода могут служить подспорьем, но 100% машинный перевод безо всякого участия человека - это такой же нонсенс, как машинная литература или машинная журналистика.

| 0 А сами себе-то (а не компу) объяснить сможем почему на столе тарелка стоит, а вилка лежит?
Показать новые комментарии (0)monitor-spb
Чтоб я так жил
Miss Understanding
trick
Чтоб я так жил
trick
liova01
А у аглицкоорусского строение фразы ргое. Машина этого пока не понимает.
darksky
Хм, в переводе вашего предпоследнего предложения на любой язык, у меня возникли бы проблемы. Хотя я не машина. ;)
liova01
Очепятка
Чтоб я так жил
Языковой единицей речи является предложение, а не слово. Современная речь наполнена фразеологизмами (событийными отсылками) и речевыми шаблонами. Злесь ещё подмешено словообразование и орфография. языки европейской части похожи на клинопись, азиатская иероглифика более семантична, отражая более древнюю культуру цивилизации. Последняя лучше подходит для обучения и машинно-человеческого языка. Помните кодировку в фильме "Матрица", где герои за колонками символов видели "блондинок" и "брюнеток"?
Вторая сигнальная система — самый медленный инструмент коммуникации. Но он сохранился как средство для передачи в пространстве и времени, будучи перенесенному на носители (бумагу, радиосигнал, память двоичного компьютера). Прогресс развития компьютерных технологий в область нейровычислений повысит производительность машин как средства коммуникации. Ведь книга — это тоже общение, только в оффлайне и односторонне. Не забываем про язык нот (музыки). Переход к семантической выразительности (не эмоджи☺, конечно) позволит приблизить нас к технической телепатии, созданию общечеловеческого разума — нового этапа развития интернета.
liova01
Попробуйте перевести на английский: "сливеют губы с холода"
Miss Understanding
Однажды ради прикола забила в Google-переводчик фразу "Жили у бабуси два весёлых гуся", получила следующий результат: "Grandma lived with two gay geese". Всё, что надо знать о машинном переводе)))
orevich
в ответ(Показать комментарийСкрыть комментарий)