Несмотря на то, что японская мифология полна самых разных злых духов, они остаются лишь плодом фантазии. Однако есть и реальные сущности, пришедшие из японского языка, которые «живут» прямо у вас в компьютере. Что такое «знаки-призраки» и откуда они взялись?
70-е годы прошлого века ознаменовались стремительным развитием компьютерной техники. Вслед за появлением ПК распространение получили узкоспециализированные устройства – текстовые процессоры, которые активно заменяли печатные машинки. И если в Европе и других регионах, в которых использовали латиницу или кириллицу, переход на новые устройства не составлял особых проблем, то в Японии всё было иначе. Текстовый процессор должен был иметь возможность вводить тысячи различных знаков-кандзи, и создание подобной машины было нелёгкой задачей.
Для решения проблемы в том числе было необходимо определить общий для всех устройств список иероглифов, которые были бы доступны для ввода, а также универсальный способ их кодирования. Итогом этой работы стал иероглифический список JIS C 6226 (сейчас он называется JIS X 0208), ставший новым стандартом. Его составило Министерство экономики, торговли и промышленности Японии в 1978 году. В этот иероглифический список вошло более шести тысяч знаков, которые использовали для записи слов японского языка, имён и топонимов.
Позже обнаружилось, что помимо действительно важных и активно используемых иероглифов в новый промышленный стандарт попали и загадочные кандзи, информации о которых не было даже в крупных словарях. Тогда их, по аналогии с английским термином ghost word «призрачное слово», которым обозначают слова, по ошибке попавшие в словари, стали называть 幽霊文字 ю:рэй-модзи «призрачные знаки».
Проблем добавлял и тот факт, что в документах, которые описывали стандарт, не было указано, из какого именно источника был взят тот или иной иероглиф. Из-за этого исследователи всё время называли разное количество «призраков» – у некоторых их число доходило чуть ли не до сотни.
В 1997 году Сибано Кодзи, председатель комитета по созданию стандарта, и Сасахара Хироюки из Национального института японского языка и лингвистики провели тщательное исследование всех материалов, на основе которых составлялся список иероглифов. Благодаря их работе удалось выяснить, что большая часть неизвестных знаков попала в стандарт 78-го года из двух источников: «Списка именных иероглифов клиентов Nippon Life» (яп. 日本生命収容人名漢字 нихон сэймэй сю:ё: дзиммэй кандзи) и «Общего перечня административных районов» (яп. 国土行政区画総覧 кокудо гё:сэй кукаку со:ран). Ещё более 30 иероглифов удалось обнаружить после изучения телефонных книг и баз данных японских телекоммуникационных компаний.
Однако происхождение не всех иероглифов удалось отследить. Так, во всех устройствах, включая то, на котором вы читаете данную статью, по сей день живут двенадцать «призраков», следы которых можно найти разве что в древних текстах.
妛
Этот иероглиф попал в список из-за населённого пункта Акэмбара (𡚴原) в префектуре Сига. При занесении в список напечатать его обычным способом было невозможно, и составителям пришлось собрать его вручную, как конструктор: от одного иероглифа взяли элемент 女, а от другого – 山. Однако во время этого процесса произошла ошибка, и над 女 осталась лишняя горизонтальная черта, которая попала и в итоговый вариант.
Помимо этого, лишняя черта могла появиться из-за тени, которая возникла при наложении двух листов бумаги.
Из-за внешнего вида его ещё называют やまいちおんな, или 山一女 ямаитионна, что буквально обозначает элементы, из которых состоит знак: гора, единица, женщина.
Также этот иероглиф встречается в словаре 字鏡集 дзикё:сю: периода Камакура (1185–1333 гг.), но скорее всего это не более чем ошибка при написании.
閠
Вероятно, знак появился из-за ошибки при копировании иероглифа 閏 из слова 閏年 уру:доси «високосный год». Также он встречается в китайском словаре «Гуанъюнь» XI века и буддийских текстах, но считается ошибкой. Вместо элемента 王 «король» в центральную часть иероглифа попал 玉 «жемчужина».
挧
Вероятно, появился из-за ошибочного написания левой части иероглифа 栩. Главным элементом, ключом иероглифа, должно было быть 木 «дерево», однако авторы переписали его с «рукой», 手.
Встречается в китайском иероглифическом словаре «Чжунхуа цзыхай» 1994 года.
暃
Если у других юрэй-модзи обычно есть один или два предполагаемых «предка», то у 暃 их заметно больше. Его считают ошибочной копией одного из следующих символов: наиболее вероятными считаются 杲 и 晁, но также есть варианты 星, 泉, 皇 и так далее. В таком же написании встречается в нескольких древних текстах в качестве альтернативной формы иероглифа 罪 «грех, преступление».
椦
Появился из-за ошибок при копировании иероглифа 橳 из названия посёлка Нэдэдзима (橳島町 Нэдэдзима-мати). Из изначального кандзи по ошибке «вырезали» центральный элемент 月. Несмотря на то, что его не удалось обнаружить в источниках, на которые опирались составители стандарта, этот же иероглиф можно встретить в старейшем китайском словаре буддийских терминов «Ице Цзинъинь И» VII века нашей эры.
槞
Судя по всему, появился из-за ошибочного написания иероглифа 橦 «древко (флага), столб»: элемент 童 «ребёнок» при переписывании превратился в 竜 «дракон».
袮
Появился из-за ошибочного копирования левой части иероглифа 祢 «усыпальница; катасиро». Ранее встречался в нескольких топонимах, например, Нэгидани (祢宜谷) в префектуре Тоттори, но позднее был заменён на правильный знак. Если вы изучали японские иероглифы и хотя бы раз путали левый элемент в знаках вроде 神 или 袖, помните: вы не одни.
Знак с таким написанием встречается в древних текстах в качестве альтернативной формы иероглифа 袗 «однослойное кимоно».
蟐
Вполне возможно, что это иероглиф – единственный из «призраков», попавший в эту группу по ошибке. Однако есть загвоздка: проверить это уже невозможно, потому что утрачены документы страховой фирмы, из которых он был позаимствован. Поэтому есть шанс того, что 蟐 на самом деле встречался в имени одного из клиентов компании. При этом имя, судя по всему, было крайне редкое, поскольку в базе данных телекоммуникационной компании NTT не было ни одного человека с таким иероглифом.
Также есть версия, что это просто ошибочное написание кандзи 蟷 «богомол».
駲
Некоторые словари указывают данный иероглиф как альтернативную форму кандзи 馴 «привычка, знакомство», однако оснований для этого нет. Несмотря на то, что знак с таким написанием встречается в нескольких японских словарях периодов Хэйан (794–1185 гг.) и Эдо (1603–1868 гг.), исследователи не видят их связи с современным иероглифом из JIS.
墸
Вероятно, появился из-за ошибочного копирования иероглифа 堵 «ограда, забор».
壥
Этот иероглиф в перечне заменил свою предположительно верную версию, знак 㕓 «лавка; особняк, имение». При этом, в отличие от верных форм других иероглифов, 㕓 так и не попал в JIS.
彁
Этот иероглиф выделяется среди других юрэй-модзи тем, что о нём нет абсолютно никакой информации. Его происхождение не установлено, источник, из которого он попал в стандарт, тоже неизвестен. В отличие от других иероглифов, у него даже нет ни одного сходства со знаками из древних книг и словарей, он впервые появился уже в документе стандарта. Единственная гипотеза насчёт его происхождения предполагает, что этот иероглиф является альтернативной или ошибочной формой знаков 彊 «сильный» (в современности записывается как 強) или 謌 «песня», но не существует ни одного примера, который бы подтверждал это.
Точнее, исследователи не нашли его в 1997 году. Позже, когда газета Асахи запустила сервис, с помощью которого можно было искать статьи из старых выпусков, случилось невероятное – 彁 удалось обнаружить среди ключевых слов в одной из вырезок 1920-х годов.
В данном тексте этот иероглиф является частью словосочетания 埼玉自彁會. Но есть и другие сканы с этим словом, на которых знак видно гораздо чётче:
Так стало известно, что надпись 埼玉自彁會 на самом деле должна выглядеть как 埼玉自彊會 Сайтама дзикё:кай. Это название буддийской благотворительной организации, которая существовала в префектуре Сайтама с 1890 по 1969 годы. Таким образом подтвердилась версия о том, что 彁 является вариантом 彊.
А как их читать?
Короткий ответ: никак. Поскольку этих иероглифов в принципе не существовало в языке до их появления в стандартах кодировки, ни чтений, ни значений у них формально нет. Но только формально: на самом деле за каждым из иероглифов в списке закреплены чтения, благодаря которым их можно без особых трудностей напечатать с помощью клавиатуры (правда, в некоторых случаях придётся долго листать список предлагаемых вариантов с нужным чтением).
Почему «призраков» не изгоняют?
Теперь, когда мы узнали, что все юрэй-модзи (разве что за исключением 蟐, и тот под вопросом) наиболее вероятно появились по ошибке, возникает вполне закономерный вопрос: почему они до сих пор есть в иероглифическом стандарте и Юникоде? Разве не было бы легче вычеркнуть их из списка и поставить на их место какие-нибудь полезные и нужные знаки?
Поступить так нельзя по той причине, что любые замены в Юникоде вызывают огромные трудности с совместимостью и отображением символов. В 80-х произошёл, скажем так, Юникод-кризис, который получил название «Проблема Мори Огая» (яп. 森鴎外問題 Мори О:гай мондай).
Дело было в 1983 году, когда были приняты новые поправки к стандарту кодирования иероглифов. Заключались они, казалось бы, в мелочах: у некоторых иероглифов заменили номера и поменяли их формы на упрощённые. Обычно при добавлении новых форм тех же иероглифов им дают новый номер, чтобы традиционные знаки отображались верно в тех ситуациях, когда это необходимо, например, в именах. Вот пример: кандзи 区 (упрощённый) и 區 (традиционный) имеют разный индекс, несмотря на то, что по сути они являются одним и тем же иероглифом. Однако в 1983 году всё пошло не по плану, и 300 знаков были полностью заменены своими упрощёнными вариантами. Помимо этого проблемы вызвало и то, что некоторые иероглифы первого уровня JIS (наиболее распространённые) поменялись местами с иероглифами второго уровня.
Так при чём здесь японский писатель Мори Огай? Из-за этих замен на разных устройствах его имя отображалось неверно: 鴎外 вместо 鷗外. И он, конечно, не был единственным пострадавшим от замены иероглифов.
Чтобы не допустить повторения подобных случаев, стандарты, особенно настолько распространённые, как JIS X 0208, стараются не менять без настоящей необходимости. А значит, эти призраки со своими историями и дальше будут с нами.
Источники:













Спасибо за статью!