Мы в Бюро переводов iTrex следим за спортивными достижениями в Пекине и усиленно готовим переводы для наших клиентов, но нельзя же взять и не запостить продолжение интересной истории про компьютеризацию китайской письменности? Поэтому вот оно – с пылу с жару!
В сентябре 1969 года Чжи был освобожден после 14 месяцев заключения. О возвращении в Министерство не могло быть и речи. Теперь он подметал полы, чинил инструменты на фабрике, был сторожем на складе, а в свободное время – продолжал работу над схемой кодирования. Из иностранных журналов и газет, которые ему удалось раздобыть, Чжи узнал, что Япония добилась прогресса в цифровизации иероглифов: японцы использовали элементы символов, чтобы находить, извлекать и печатать их на экране компьютера. Но клавиатура содержала более 3600 символов, каждый из которых занимал одну клавишу. Это было непрактично! Компания из Австралии также искала пути решения – там использовали более скромную клавиатуру из 33 клавиш и получили доступ к почти 200 символам нажатием всего одной кнопки. Похожая работа велась и в США, где экспериментальные модели использовали 44 клавиши. Системы ввода традиционных иероглифов разрабатывали ученые из Тайваня.
Чжи чувствовал себя воодушевленным. Несмотря на то, что большинство проектов провалилось (разработчики так и не смогли освободиться от громоздких клавиатур), он верил в свой успех.
Разбивка иероглифов на составляющие достаточно хорошо работала для специальных указателей поиска символов и клавиатур пишущих машинок, но это не позволяло напрямую программировать процесс для вычислительной машины. Китайский ученый помнил о преимуществе подхода, основанного на форме, когда части символа помогают непосредственно идентифицировать весь символ. Чтобы интегрировать этот полезный принцип в свою схему кодирования, Чжи решил индексировать символы по их составляющим, используя первую букву пиньиньского написания каждого компонента.
В среднем каждый иероглиф можно разбить на два-четыре компонента, а всего их насчитывается 300-400. Большинство иероглифов легко разделить на две половины – вертикальную или горизонтальную – наряду с другими возможными геометрическими формами. Благодаря такому подходу удалось создать алфавитный код из двух-четырех букв для каждого китайского иероглифа: чтобы ввести один символ необходимо нажатие не более четырех клавиш на обычной англоязычной клавиатуре. Для сравнения – средняя длина английского слова составляет почти 4,8 буквы. Система также ловко справилась и с проблемой диалектных различий и омофонов. Поскольку в коде использовалась только первая буква, а не полный звук иероглифа, большинство региональных различий в речи не имели значения. Четырехбуквенный код работал как акроним различных частей иероглифа. Все гениальное – просто!
На воплощение этой идеи у Чжи ушло два года. Согласитесь, скорость работы китайского ученого поражает!
Способ Чжи индексировать символ по его компонентам упростил ввод китайского языка (конечно, при условии, что вы знаете, как писать на этом языке). Например, в его системе иероглиф «дорога», 路 (lu), который имеет 13 штрихов, можно разбить всего на четыре компонента: 口 (kou), 止 (zhi), 攵 (pu) и 口 (kou). Изолирование первой буквы каждого компонента дает код иероглифа KZPK. Или возьмем иероглиф 吴 (wu), распространенную фамилию, которую можно быстро разложить на две части, 口 (kou) и 天 (tian), что дает иероглифический код KT.
Если вы задумывались или уже точно решили начать учить китайский, но не знаете, с чего начать? Тогда наш гайд вам точно будет полезен. Читать здесь >>>
Этот метод индексации может использоваться и для групп символов: семь иероглифов, составляющих «Китайскую Народную Республику» – Zhonghua renmin gongheguo – 中华人民共和国, можно просто набрать как ZHRMGHG. С таким написанием мы еще не сталкивались!
Чжи официально представил систему кодирования «On-Sight» в китайском научном журнале Nature Magazine в 1978 году. Он описал ее как топологическую – экстраполированную из геометрии деталей. Четырехбуквенные коды, на базе 26 букв алфавита, предлагали достаточно комбинаций для создания 456 976 возможных уникальных кодов. Чжи утверждал, что его система по эффективности схожа с азбукой Морзе – быстрая, интуитивно понятная и прозрачная.
Компьютеры наконец-то смогли «понять» иероглифы квадратной формы. После более чем десятилетней изоляции Китай получил возможность общаться со всем миром и управлять собственным потоком информации в цифровом формате.
Мы Бюро переводов iTrex имеем дело с разными языками, и с китайским в том числе, поэтому, если вам срочно нужен перевод, обращайтесь – пишите нам на почту info@itrex.ru или звоните по телефону +7 495 739–5696.
И обязательно подписывайтесь на нас! У нас еще много интересных историй!
Как заключенный совершил революцию в китайском языке с помощью чашки. Часть 1