Вокруг Google Fonts есть устойчивое ожидание: раз это крупнейшая публичная библиотека бесплатных шрифтов, значит она «отражает мир» — и по языкам, и по письменностям, и по качеству инженерии. На практике Google Fonts отражает прежде всего индустрию: какие рынки и команды умеют производить шрифты в больших объёмах, какие пайплайны автоматизации существуют, какие письменности встроены в типичную инфраструктуру дизайна, а какие остаются «дорогими» и редкими.
Я собрал статистику на основе библиотеки языков Google Fonts (983 языка), общему массиву шрифтов Google Fonts (3848 шрифта) и новой версии сервиса Font Tester SP, который скоро будет опубликован. Ключевой критерий такой: шрифт считается поддерживающим письменность, если он поддерживает хотя бы один язык этой письменности на уровне SUPPORTED (полная поддержка по модели датасета). Это важно: мы считаем не «есть ли пара букв», а «закрывает ли шрифт хотя бы один язык целиком» из крупного датасета.
Дальше — выводы, которые получаются, если перестать смотреть на цифры как на «рейтинги» и начать читать их как структуру рынка шрифтового дизайна.
Сколько всего шрифтов и почему латиница почти «везде»
По данным латиница поддержана в 3763 шрифтах и это 97.791%.
Это полезная опорная цифра: дальше все проценты можно приземлять к реальному масштабу.
Латиница в 97.8% — не «победа латиницы», а просто базовая реальность цифровой типографики: огромная часть инструментов, тестов, производственных процессов и ожиданий пользователей заточены под латиницу. Для Google Fonts это ещё и регламентирующий критерий: большинство проектов хотят латиницу «по умолчанию», а дальше, если повезёт, добавляют остальное. И правила размещения шрифтов на Google Fonts так или иначе следуют этому критерию.
Кириллица есть в ~20% шрифтов — это много или мало?
Кириллица поддержана в 757 шрифтах, то есть 19.673%. В бытовых разговорах это часто описывают как «кириллицы мало». Но если сравнивать не с латиницей (которая почти всегда будет в шрифте), а с другими письменностями, картинка резко меняется:
-
Greek: 383 шрифта (9.953%)
-
Thai: 259 (6.731%)
-
Devanagari: 214 (5.561%)
-
Hiragana: 202 (5.249%)
-
Hebrew: 144 (3.742%)
-
Arabic: 117 (3.041%)
-
Korean: 71 (1.845%)
То есть кириллица в Google Fonts встречается примерно в каждом пятом шрифте — и это вторая по представленности письменность после латиницы. Похоже, что времена, когда кириллица была аутсайдером в мире шрифтового дизайна прошли.
Интерпретировать это можно и так: «положение кириллицы» в GF — это не про число носителей, а про то, что кириллица относительно дёшево и технологически привычно добавляется в проекты, которые и так делаются для латиницы (особенно в гротесках и акцидентных семействах). Для ряда других письменностей добавление означает совсем другой уровень компетенций, проверки рендеринга, локальные нормы и часто отдельную команду. Рационализация формы играет на руку дизайнерам.
Почему некоторые «более крупные по числу носителей» письменности ниже кириллицы
Сам по себе вопрос «почему арабица 3%, а кириллица 20%» не имеет демографического ответа. Это относится скорее к правилам индустрии.
Арабица, деванагари, бенгали, тамил и другие сложные системы письма требуют не просто набор букв. Для них критичны:
-
сложная шейпинг-логика (контекстные формы, лигатуры, позиционирование знаков);
-
специфические типографические нормы;
-
более высокая цена проверки качества;
-
меньше универсальных «скелетов» проектов, которые легко расширяются.
Поэтому в открытых каталогах эти письменности часто представлены не по числу носителей, а по возможности относительно легко и быстро добавить в шрифт поддержку схожих по форме с латиницей символов — к слову, арабицей в той или иной форме пользуется около 700 млн человек по всему миру, тогда как кириллицей всего около 350 млн.
Хирагана и «Japanese»: почему в таблице две разные сущности и как это читать
В топе использования письменности есть и «Hiragana» (202), и «Japanese» (136). Это важное свидетельство о том, что модель «письменность ↔ язык» не всегда выглядит как один столбец.
Практический вывод: при автоматической оценке покрытия нужно быть внимательным к тому, что один и тот же «реальный» языковой сценарий (японский) распадается на несколько подсущностей — в зависимости от того, как датасет связывает языки и письменности. И если в интерфейсе инструмента просто показывать «есть японский / нет японского», можно потерять полезную диагностику: шрифт может закрывать один компонент сценария и проваливать другой.
Это как раз то место, где новая версия Font Tester SP может дать ценность: показать не «флажок», а структуру покрытия.
Самые «полные» по языкам: лидерство, которое нельзя трактовать буквально
Топ по языкам в датасете Google Fonts такой:
-
Adobe Blank — 983 языка (100%)
-
Noto Sans — 908 (92.37%)
-
Arimo — 894 (90.946%)
Далее идут семейства из группы Noto, Gentium, SIL-семейства и т. д.
Эти данные нельзя трактовать буквально и легко сделать ошибку: «Adobe Blank — лучший по языкам». Adobe Blank — это специальный служебный шрифт, разработанный компанией Adobe, который фактически является «невидимым» в библиотеке Google Fonts, но доступен в репозитории. Он предназначен не для набора текста, а для решения технических задач в веб-разработке и дизайне. Шрифт содержит более миллиона кодовых точек Unicode, но каждая из них отображается как пустой (не имеющий ширины и начертания) глиф. Его используют для предотвращения «мелькания системного шрифта» (Flash of Unstyled Text) при загрузке веб-страницы. Пока основной шрифт подгружается, Adobe Blank «скрывает» текст, чтобы пользователь не видел резкой смены начертаний.
У Adobe Blank unicode_cp = 1,111,998 — это не «очень много», это на несколько порядков больше, чем у остальных. То есть это по сути технический «ковёр» символов. Он полезен как контрольный объект или как способ «не получить tofu», но это не то, что вам нужно для коммуникационного дизайна и типографики. Однако, было решено оставить его в статистике, чтобы сравнение было полным.
Можно сравнить: Noto Sans — 3094 кодпоинта, Arimo — 3010, при этом языков тоже много. Это другая модель полноты: не «всё подряд», а тщательно собранные блоки для широкого практического покрытия.
Отсюда важный принцип интерпретации: языковая полнота и объём символов — разные оси проверки.
Типы шрифтов, поддерживающих кириллицу
Топ-20 по кириллице интересен тем, что там смешаны разные «архетипы» семей.
Есть группы с максимальным кириллическим набором (cyr_cp = 304) и огромным языковым покрытием (langs около 892–908). Это Noto Sans/Serif (Display), Open Sans Condensed, Arimo.
Отдельно тут также выделяется Adobe Blank: cyr_cp = 304, но cyr_share = 0.027%. Это почти идеальный пример того, зачем вообще нужен показатель «доля письменности»: наличие кириллицы в сверхуниверсальном шрифте не означает, что кириллица является частью замысла или существенным компонентом набора. Она просто присутствует в массиве.
Есть и другой тип: моноширинные/кодовые семейства, где cyr_cp меньше (например, 275–288), но cyr_share существенно выше (Roboto Mono: 31.465%; Roboto Slab: 30.522%; Roboto Condensed: 29.826%). Это не «хуже» и не «лучше» — это признак фокуса. Такие семейства часто оптимизируют набор под практические сценарии и держат пропорцию письменностей иначе.
Отсюда новая интерпретация, которую стоит прямо проговорить в статье как отдельный тезис: для кириллицы важно разделять «широту» и «удельный вес». Широта — это сколько языков закрывается. Удельный вес — это насколько кириллица является значимой частью набора.
Что эта статистика говорит о Google Fonts как системе
Если смотреть на топ письменностей целиком, получается структурный портрет библиотеки:
-
Это библиотека, где латиница — отраслевая необходимость.
-
Кириллица — «вторая линия» расширений, которые относительно легко добавляются к латинице в массовых семействах.
-
Большинство остальных письменностей живут в режиме «специализированных проектов»: их мало не потому, что они не нужны, а потому что стоимость производства и проверки гораздо выше.
И важная ремарка: даже цифра «есть поддержка письменности» не говорит о качестве дизайна, о читабельности, о типографической корректности локальных норм. Она говорит только о прохождении формального порога модели SUPPORTED. Это не слабость статистики — это её граница применимости.
Практические выводы для Font Tester SP
Если переводить статистику в продуктовые решения, то напрашиваются такие выводы:
-
«Latin-only» — не должен быть единственным дефолтом. Поскольку кириллица встречается примерно в каждом пятом шрифте, дефолтные пресеты проверки «Latin + Cyrillic» логично держать рядом, а не прятать в глубине.
-
В отчёте нужно показывать два слоя покрытия: «письменности» и «языки». Письменности дают быстрое понимание масштаба, языки — конкретику. Одно без другого либо слишком общее, либо слишком бессмысленное.
-
Нужна защита от ложных лидеров. Семейства вроде Adobe Blank нужно маркировать отдельно.
-
Показатель доли письменности (аналог cyr_share) — не декоративный, а диагностический. Он отвечает на вопрос «это органическая часть набора или случайность». Для типографа это часто важнее, чем просто «есть кириллица».
Заключение
Главный смысл этой статистики не в том, чтобы назвать «самый полный шрифт», а в том, чтобы увидеть структуру: что в Google Fonts является нормой, что — массовым расширением, а что — специализированной зоной с высокой ценой производства.
В этой картине кириллица выглядит сильнее, чем принято считать: порядка 20% шрифтов в каталоге закрывают хотя бы один кириллический язык на уровне SUPPORTED. Это не сравнимо с латиницей, но это существенно выше большинства других письменностей и достаточно, чтобы считать кириллический набор важным для шрифтового дизайна.