Вы сейчас просматриваете Машинный перевод: история

Машинный перевод: история

Искусственный интеллект стал привычной частью нашей жизни. Новые технологии помогают и в бытовых задач, и в работе. Все знают: сегодня чтобы перевести письмо от зарубежного коллеги,  можно просто загнать текст в гугл. Не идеально, но в целом понятно. А ведь буквально лет десять назад для этого требовалось звать переводчика или, как минимум, самому сидеть со словарем.

Как развивался машинный перевод — этапы, предпосылки и прочее. Сегодня у нас небольшой, но увлекательный экскурс в историю. 

Пройдите за 3 минуты короткий квиз в нашем телеграм-боте и получите бесплатный тестовый перевод и скидку 10%!

Начнем?

Стереть языковые барьеры

Чтобы вы сегодня могли быстро и без особых усилий перевести текст любимой иностранной песни или пост в социальных сетях, ушли десятки и даже сотни лет кропотливого труда математиков, инженеров и лингвистов. 

Эпоха великих открытий стерла морские и сухопутные географические границы, но остались языковые барьеры. В 17 веке ученые видели два пути решения проблемы:

  1. Создание единого языка, который было бы просто выучить любому жителю планеты. 
  2. Создание технологии, которая позволит понимать любой язык без усилий и многих лет кропотливой учебы.

Сначала гении того времени ухватились именно за первую идею. Кстати, она пришла Рене Декарту и Готфриду Лейбницу практически одновременно. Оба математика скептически относились ко всем языкам мира, считая их нелогичными. 

Было предложено создать тот самый логичный универсальный язык, который поможет понять любого чужеземца.Таким языком стал эсперанто, появившийся лишь через два века. 

Его создал варшавский лингвист и окулист Лазарь Маркович Заменгоф в 1887 году после 10 лет работы. На эсперанто до сих пор публикуются книги (в России, Чехии, Италии, США, Бельгии), вещают радиостанции (В Китае, Австралии, Бразилии и Польше), а в Венгрии этот искусственный язык даже преподают в некоторых школах. 

Алфавит Эсперанто
Алфавит Эсперанто
Источник: сайт TeenAge

Но пик популярности эсперанто пришелся на первую треть 20 века, когда на нем говорили многие деятели мировой революции и их сторонники. Благодаря развитию радио, к концу 20-х годов эсперанто зазвучал на 82 радиостанциях в 23 странах мира.  

Первые несмелые шаги

Честь первых шагов принадлежит нашим соотечественником. Ну, или почти. Французский изобретатель Жорж Арцруни был армянином, выходцем из бывшей Российской империи. В его светлой голове родилась идея первого машинного переводчика, который, конечно, сильно отличался от современных.

Первый машинный переводчик Жоржа Арцруни
Первый машинный переводчик Жоржа Арцруни
Источник: сайт CafeTran

Кстати, помимо переводчика устройство использовалось для:

  1. составления телефонных справочников;
  2. упорядочения финансовой документации;
  3. шифровки и дешифровки.

Это изобретение было первым устройством с памятью, на котором можно хранить информацию. 

Следом за Жоржем Арцруни уже в СССР Петр Троянский представил научной общественности собственную систему машинного перевода. 

Системой Троянского воспользовались и позднее — при создании клавиатуры для компьютера. Но в комплекте к устройству должен был прилагаться грамотный редактор, который приводил бы в читабельный вид полученный текст. 

И 100 лет назад, и сегодня машина без человека не может сделать перевод высокого качества. 

Схема системы Троянского
Схема системы Троянского Источник: aclanthology

Принцип работы устройства был весьма сложен. Оператору необходимо было брать каждое слово из текста и делать его фото, а на печатной машинке вводить всю морфологическую информацию о данной лексической единице (число, падеж и др.). 

По причине закрытости Советского Союза и вскоре начавшейся Второй Мировой Войны изобретение советского инженера дошло до мировой научной общественности лишь в середине 20 века.

На Youtube-канале iTrex еще больше интересного и полезного контента о переводах, языках и международном бизнесе. Заходите и жмите на колокольчик! 🔔

В 40-х годах концепцию машинного перевода сформулировал американский ученый Уоррен Уивер. В основу технологии он заложил идею декодирования. 

Как это работало:

  1. Был изобретен язык-посредник. Своему детищу он дал имя «interlingva». Это был упрощенный вариант английского языка.
  2. Предложение или текст сначала переводили на него. 
  3. Затем делался перевод на требуемый язык.

То есть, interlingva был языком декодирования. Теория американского специалиста положила начало новому периоду в развитии человечества – эре машин-переводчиков.

Уоррен Уивер - автор теории декодирования
Уоррен Уивер — автор теории декодирования
Источник: сайт wiki2

На заре новой эры 

Эру открыла корпорация IBM, которая в середине 50-х провела первый в своем роде эксперимент, получивший название Джорджтаунский. Компьютерный переводчик, созданный специалистами корпорации и запущенный на компьютере 701 модели, смог справиться с 60 предложениями на русском языке. 

Как это было:

  1. Оператор вводил предложения на перфокартах.
  2. Машинный переводчик выдавал результат, который печатался транслитом.

Для перевода были выбраны не только предложения общей тематики. Часть экспериментального текста была научной — из области органической химии. 

Новый машинный переводчик выдавал перевод с невероятной для того времени скоростью (две с половиной строки в секунду).

Джорджтаунский эксперимент
Джорджтаунский эксперимент
Источник: timetoast

Компьютерный переводчик IBM учитывал только 6 синтаксических правил, а его словарь ограничивался парой сотен слов.

Общество охватило всеобщее ликование: газеты выдавали один громкий заголовок за другим, а американские власти и частные компании готовы были выложить любые деньги на развитие новой технологии. Корпорация IBM начала упорно развивать свой машинный перевод, но последующие проекты были слишком сложными и дорогими. В итоге эксперты того времени пришли к неутешительному выводу о бесперспективности направления, а их отчет похоронил на некоторые время все дальнейшие попытки развития машинного перевода.

Финансирование всех проектов в этой сфере заморозили до 80-х, а общественность в течение этих 20 лет воспринимала машинный перевод как научную фантастику. 

Тем не менее, энтузиасты остались, и одним из них был Питер Тома, глава им же созданной компании «Systran».Несмотря на скептическое отношение со стороны властей и общества, он продолжил разработку систем машинного перевода. Первые его системы работали на основе лингвистической информации и значительно ускоряли перевод текстов.

Считается, что именно вкладу Питера Тома системы машинного перевода обязаны своей востребованностью — их начали использовать практически все международные компании. 

Машинный переводчик SYSTRAN
Машинный переводчик SYSTRAN
Источник: сайт caisu1.ning

А в это время…

Джорджтаунский эксперимент не оставил безучастными и советских ученых, которые занялись разработкой системы машинного перевода еще в 50-х. В то время работали две конкурирующие группы ученых под руководством математиков Дмитрия Панова и Алексея Ляпунова. Последний, кстати, был «отцом» кибернетики в Советском Союзе.

Им понадобился всего лишь год на изучение опыта своих американских коллег – и были готовы собственные наработки. Опыты проводили на отечественном компьютере БЭСМ. 

Первый советский компьютерный переводчик
Первый советский компьютерный переводчик
Источник: блог LiveJournal

Некоторое время спустя  под руководством Панова был выпущен переводчик со словарным запасом более 2000 слов. Его конкурент Алексей Ляпунов «дышал в спину» и уже заканчивал свой вариант машинного переводчика.

Пришла пора подключаться к работе и языковедам. На кафедре перевода МГПИ было создано первое неформальное общество машинного перевода. В отличие от США, в нашей стране по поводу развития систем машинного перевода было больше энтузиазма – в конце 50-х была даже проведена всесоюзная конференция с участием нескольких сотен специалистов.

Конференция привлекла внимание государства, которое впоследствии поддерживало все разработки в этой сфере. 

К началу 70-х в Москве началась практическая работа по созданию системы машинного перевода – ЭТАП.

Одновременно с этим в северной столице начала функционировать Научно-исследовательская лаборатория инженерной лингвистики. Ее коллектив занимался разработкой компьютерных переводчиков. А после развала СССР именно эти люди стали костяком компании PROMT во главе со Светланой Соколовой.

Современные компьютерные переводчики

Первая российская система PROMT вышла в начале 90-х. Она прекрасно справлялась, в том числе, и с переводом специализированной лексики.

Первый российский компьютерный переводчик
Первый российский компьютерный переводчик
Источник: сайт myshared

Уже скоро PROMT начала поставлять свои решения для NASA. Кстати, сотрудничество с космической отраслью стало долгосрочным, а в 2005 году системы PROMT стали использоваться на Международной космической станции.

Во второй половине 90-х была разработана первая российская система для операционной системы Windows. 

Важной вехой на пути PROMT, российского лидера в сфере информационных технологий, стал договор с французскими коллегами из Softissimo. 

Эта французская компания работала с крупнейшим немецким издательством словарей Langenscheidt. Совместно с PROMT они занялись распространением компьютерных переводчиков с французского на немецкий на территории Германии. 

И, наконец, к концу 90-х власти оценили усилия и заслуги компании и вручили им почетную национальную награду.

Это приятное событие совпало с выпуском Magic Gooddy, компьютерного переводчика от PROMT. Главный персонаж гусь Гудди (аналог популярного анимационного героя дятла Вудди) владел двумя языками – русским и английским. Машинный переводчик был задуман для школьников, но стал популярным и среди взрослых пользователей.

Компьютерный переводчик Magic Gooddy - лучший друг детей конца 90-х
Компьютерный переводчик Magic Gooddy — лучший друг детей конца 90-х
Источник: сайт center-soft

Команда PROMT не останавливалась на достигнутом – вскоре появился первый российский онлайн-переводчик Translate.Ru. 

Машинным переводчиком тех времен стоило пользоваться с большой осторожностью во избежании нелепых ситуаций. Аналогичная ситуация и сейчас: если вам нужно перевести важный документ, стоит доверить работу с ним профессиональному бюро переводов.

Почему машинный переводчик может стать ложным другом, мы рассказали в этой статье.

Тем временем за океаном уже знакомый нам американский гигант IBM занимался разработкой систем нового поколения, которые совершеннее работали с идиомами, омонимами и многозначными словами. В 2000-х эти системы научились переводить не только отдельные слова, но и целые фразы.

Среди пользователей сегодня особо популярны два машинных переводчика – Яндекс Переводчик и Google Translate. Хотя, конечно, если прогнать фразу с помощью Google Translate через несколько языков, то исходный вариант будет сложно узнать.

Машинный перевод
Машинный перевод
Источник: сайт ppt-online

В 2016 году пришло время нейросетей – и единицей перевода стало уже не слово. Нейросети уже рассматривают предложение не как сочетание отдельных слов, а как цельную единицу текста, что уменьшает количество ошибок в переводе. Но пока заменить профессионального переводчика они не смогут. Машинным переводчикам последнего поколения не под силу многозначные лексемы или игра слов. Результат машинного перевода можно отличить от результата работы профессионального переводчика по следующим параметрам:

  1. ИИ пока не учитывает особенности культуры страны.
  2. Нейросети с трудом справляются с формулировками в переносном смысле.
  3. Искусственный интеллект пока не способен передать эмоции художественных произведений.

Нейросети, как и настоящие переводчики, проходят своеобразное обучение. В качестве примеров им выдают реальные тексты и их переводы. Стоит отметить, что качество работы искусственного интеллекта для разных языковых пар значительно отличается. Например, перевод с немецкого на английский нейросети делают вполне сносно, а с китайского на иврит переводить у них получается пока плохо. 

Резюме

Машинный перевод продолжает стремительно развиваться, ведь в мире еще много людей, не знающих иностранный язык. Им порой нужно в общих чертах понять о чем тот или иной текст. В этом на данный момент заключается главное назначение машинных переводчиков.

Границы между странами стираются, и возникает необходимость перевода контента на иностранных языках. Поэтому можно предположить, что эти технологии продолжат развиваться, а о перспективах развития подробнее вы сможете узнать в одной из наших следующих статей.

Пройдите за 3 минуты короткий квиз в нашем телеграм-боте и получите бесплатный тестовый перевод и скидку 10%!

Начнем?


Часто задаваемые вопросы

Каким был первый машинный переводчик?

Первый машинный переводчик был создан в 1954 году в Массачусетском технологическом институте. Он был основан на статистическом подходе и мог переводить только простые предложения.

Как развивался машинный перевод с течением времени?

В 1970-х годах машинный перевод стал более сложным и точным благодаря использованию методов искусственного интеллекта. В 1980-х годах появились коммерческие системы машинного перевода, которые стали доступны широкой публике. В 1990-х годах развитие технологий машинного обучения привело к дальнейшему повышению точности машинного перевода.

Какие существуют основные методы машинного перевода?

Существует два основных метода машинного перевода:

  • Статистический машинный перевод основан на статистическом анализе больших объемов параллельных текстов.
  • Трансформационный машинный перевод основан на преобразовании текста из исходного языка в текст на целевом языке.

Первая версия этой статьи опубликована 7 сентября, 2023 @ 08:19

Добавить комментарий