В работе 50‑го заседания Дискуссионно‑аналитического клуба по языковой политике Института языкознания Российской академии наук, прошедшего в минувший четверг в формате онлайн, приняли участие директор ГБУ РЦ «Бэлиг» Баир Балданов и начальник отдела разработки УМК и цифровизации обучения бурятскому языку Саян Забанов. Участники обсудили актуальные вопросы цифровизации родных языков народов России.
Коммерческий директор российской компании «ПараТайп», кандидат технических наук Сергей Бобрышев представил доклад на тему: «Россия — многоязычие и монописьменность. Проблемы максимального представления многоязычного содержания в условиях минимизации письменной формы».
Эксперты затронули сложную проблему, связанную с историей письменности народов России. Было отмечено, что «молниеносный» переход на расширенную кириллицу в 30‑е годы прошлого столетия не всегда учитывал фонетические особенности национальных языков. Как следствие, в разных языках одной языковой семьи для обозначения одинаковых звуков стали использоваться разные графемы. В наши дни это создаёт трудности в развитии языковой практики.
Особое внимание участники заседания уделили вызовам цифровой эпохи. В условиях цифровизации языков народов России назрел необходимость провести комплексный анализ и ревизию существующих систем письменности. В отдельных случаях необходимо рассмотреть возможность их реформирования и выработать единые подходы к представлению многоязычного контента в цифровой среде.
На заседании клуба предложили разработать проект российского стандарта по составу национальных символов кириллической письменности.
К примеру, бурятские буквы Һһ, Өө өө, Үү присутствуют в кириллической системе Юникода и имеют свои коды:
прописная Һ: U+04BA
строчная һ: U+04BB
прописная Өө: U+04E8
строчная өө: U+04E9
прописная Ү: U+04AE
строчная ү: U+04AF
В эпоху цифровизации языков очень важно вводить именно эти национальные буквы с такими кодами, а не использовать похожие с ними символы.
Почему? Во-первых, это потеря лингвистической точности. Каждая буква с уникальным кодом Юникода обозначает конкретный звук в языке. Замена же ведёт к искажению.
Буква «өө» (U+04E9) в бурятском передаёт особый огубленный гласный звук переднего ряда. Если заменить её на «о» (U+043E) или «ё» (U+0451), фонетика слова искажается.
Буква «ү» (U+04AF) обозначает звук, отличный от «у» (U+0443). Подмена меняет произношение и может привести к непониманию.
Буква «һ» (U+04BB) передаёт глухой щелевой согласный, которого нет в русском языке. Замена на «х» (U+0445) или «с»(U+0441) полностью меняет звучание слова.
Во-вторых, это влечет за собой проблемы с обработкой текста. Современные системы (поисковые движки, базы данных, программы проверки орфографии) работают на основе кодов Юникода. При замене «өө»на «о» система не распознаёт слово как бурятское. Это снижает эффективность поиска и сортировки.
Автоматические инструменты (например, переводчики или анализаторы текста) не смогут корректно обработать текст, если буквы заменены. Сортировка по алфавиту будет неверной: слова с подменёнными буквами встанут в неправильном порядке.
В-третьих, появляются проблемы совместимости и отображения.
«Подменные» символы могут некорректно отображаться на разных устройствах и в разных программах. На одном компьютере «о» может выглядеть нормально, а на другом — превратиться в квадратик из‑за различий в шрифтах.
При отправке документа или публикации в интернете текст может стать нечитаемым, если шрифт на целевом устройстве не поддерживает подмену.
Отметим, что официальный статус бурятского языка закреплён законодательно. Использование правильных букв соответствует нормам орфографии и правописания, а также свидетельствует об уважении к языковой традиции и национальной культуре народа.











