
Когда мы вводим в Google Translate какую-нибудь белиберду, а он выдает нам в качестве перевода почти связные и иногда философские фразы, это немного пугает. Мы думаем: «Ого, ничего себе, какие глубокомысленные слова… Вот это искусственный интеллект! Надо заскриншотить!». Но почему так выходит?..
Молодой писатель и SMM-щик Роман Трунин считает, что «Google создал искусственное безумие… Google Переводчик видит в случайных буквах что-то отдаленно напоминающее ему знакомые данные. Это аналог человеческого явления парейдолии – когда видишь рожицы в текстуре обоев на стене или сфинкса на Марсе».
Почему, когда мы вводим бессвязные наборы символов, вроде «эээ эээ ааа ээээа», на выходе получаем глубокие поэтические образы вроде «Сердцебиение – одна из самых популярных песен в мире», «Моя жизнь — это вопль» или «Власть моей жизни – это всепроникающее сердце скорби»?
Отзывы клиентов о бюро переводов iTrex
«Переводили медицинские документы для поездки в Германию. Всё за 1 день, нотариально заверили. Приняли с первого раза.»
«Перевод юридических договоров RU→EN. Терминология точная, сроки соблюдены. Работаем с iTrex уже 3 года.»
«Технический паспорт с немецкого — сложный текст. Справились на отлично. Рекомендую.»
«Локализовали сайт на 4 языка с учётом культурных особенностей. Конверсия выросла на 23%.»
«Срочный перевод презентации за 4 часа. Думала, не успеют — но сделали и качественно!»
Глава команды «Google Переводчика» Барак Туровски объяснял, что «из-за сложности устройства нейросети причину возникновения той или иной ошибки перевода не всегда вообще можно отследить – механизм больше похож на самообучающийся «черный ящик». Тем не менее, для «обучения» нужен массив данных для тренировки. У текстовой информации такие массивы называют «корпусами текстов». Для сбора корпусов на «редких» языках вроде казахского Google с 2014 года использует помощь добровольцев – Google Translate Community. Возможно, именно этим объясняется странный и «драматичный» интуитивный перевод с монгольского или таджикского – просто именно такие тексты добровольцы могли загружать для аналитики.
Бывший инженер Google по машинному обучению Дмитрий Гензель поясняет: «Сервис изначально предполагает, что введенные вами данные должны иметь хоть какой-то смысл, поэтому он и продолжает искать его дальше и перебирает все возможные варианты. Он не хочет отдавать вам обратно белиберду, поэтому стремится выдать хотя бы просто законченное предложение».
Мы не могли не попробовать, вы же знаете!
и немного печальное:
Примеры переводов бюро iTrex
Хотите узнать больше о «галлюцинациях робота» и его причинах? Читайте ЭТУ статью на сайте The Village.

