39 бит в секунду — интерфейс приёма-передачи человеком речи. Все языки так или иначе подстраиваются
39 бит в секунду — интерфейс приёма-передачи человеком речи. Все языки так или иначе подстраиваются под него.
@treboit в комментариях сказал, что:
— На всех языках мы говорим, слышим, и читаем с примерно одинаковой пропусконой способностью в плане объема информации
Так вот, это долго было ощущением лингивистов, но в 2019 году всё же сели и посчитали. Работа вот.
В мире тысячи языков, и они очень разные. Количество возможных слогов (это единицы произношения) тоже разные. Чем меньше слогов в языке, тем меньше каждый несёт непредсказуемости.
Тот же японский язык — 643 разных слога, это плотность всего около 5 бит на слог. Но было подозрение, что малое количество слогов легче произносить и распознавать, поэтому можно ускорить тем речи. Действительно, носители японского говорят очень быстро — около 8 слогов в секунду. Английский язык — 6 949 разных слогов с плотностью около 7 бит на слог, но произносится медленнее — около 6 слогов в секунду. Вьетнамский язык с его сложной системой шести тонов достигает самой высокой информационной плотности в 8 бит на слог, но говорят на нём со скоростью всего 5,3 слога в секунду.
Сели считать. Взяли 17 языков с разной архитектурой из 9 языковых семей (туда попали английский, испанский, японский, вьетнамский, финский, турецкий). Взяли по 10 носителей. Каждый участник читал вслух в своём обычном темпе 15 одинаковых по смыслу текстов.
Скорость в слогах посчитать просто.
Чуть сложнее информационную плотность — используя теорию информации Шеннона, они рассчитали, сколько значимых бит в среднем содержит один слог в каждом языке. Чем больше в языке разных слогов и чем менее предсказуем следующий слог, тем выше его информационная плотность. С этой концепцией вы уже знакомы.
Главный показатель — скорость передачи информации, это скорость на плотность.
Оказалось: — Огромный разброс в скорости и плотности. Языки сильно разные. — Но! Языки с низкой плотностью информации (например, японский, испанский) произносились быстро. — А языки с высокой плотностью информации (например, вьетнамский, тайский) произносились медленно.
Есть чёткая зависимость. Чем выше информационная плотность языка, тем ниже средняя скорость речи его носителей.
Итоговый показатель почти одинаков для всех языков! Это как раз те самые 39 бит в секунду (плюс-минус 5 бит). Это значит, что есть оптимальный коридор для передачи информации. Человеческий мозг, по-видимому, наилучшим образом обрабатывает информацию, поступающую с определённой скоростью.
Если информация поступает слишком медленно, это неэффективно и требует удерживать в рабочей памяти больше данных. Если информация поступает слишком быстро и плотно, то мозг слушателя не успевает её обрабатывать, а речевой аппарат говорящего не справляется с произнесением сложных слогов на высокой скорости. Языки адаптируются под когнитивные и биологические ограничения человека.
Нет “более эффективных” языков. Все языки примерно одинаково хороши для выполнения своей главной задачи — эффективной передачи информации. Они просто достигают этого разными путями: одни берут скоростью, другие — сложностью. Правда, позже в 2025 в свежей работе это уточнили тем, что более крупные сообщества склонны использовать более сложные, но и более эффективные языки.
Дальше учёные докопались до жестового языка и до языка китов, и пока похоже, что там действуют те же ограничения, то есть узкое место в мозге на входном интерфейсе.
Если вам интересно про китов, то вот разбор работы в нашем соседнем зверском канале.
— Вступайте в ряды Фурье! — А кто это у вас за стенкой так орет, как резаная? — Да это Мария Ивановна пришла с работы и теперь отрывается на полную! — А кем она работает? — Библиотекарем.