Тексты и оценки

Введенное Бенуа Мандельбротом в 1975 году понятие фрактала ("Фрактальная геометрия природы") позволило удачно объединить многие, ранее рассматривавшиеся отдельно, явления.

Для классической модели термодинамики - идеального газа под поршнем - будем использовать термин "газовый фрактал" (чем он на самом деле и является).

Закон Клапейрона-Менделеева (1834) устанавливает связь между объемом газа V, его давлением P и абсолютной температурой Т (выбирая подходящим образом размерности):

P * V = T

Аналогично, рассматривая текст как аналог идеального газа, для сообщения (текстового фрактала), используя средний битовый размер кода W, и среднюю кратность символа Q, можно записать выражение для размера текста L:

W * Q = L

являющееся аналогом закона Клапейрона-Менделеева для идеального газа.

В деформируемой системе (газ под поршнем) под действием температуры T ("тепловой силы"), происходит изменение энтропии S ("тепловой координаты"). Процесс обратим в силу упругости системы и, как показано Сади Карно (1824) не имеет потерь, если происходит в две фазы, по двум ортогональным направлениям (изотерма и адиабата), так что взаимная мощность (произведение двух параметров) в точности равна нулю.

При этом работа деформации A = T * S полностью передается рабочим телом от источника к приемнику.

Рассматривая классическую пятизвенную схему Шеннона (передачи сообщений) применительно к сжатию сообщений без потерь (lossless data compression), находим, что цикл сжатия сообщений является точным аналогом цикла Карно, происходящим по двум ортогональным направлениям (изменение битового размера кода и изменение кратности символов). Длине текста L и его шенноновской энтропии H отвечает "количество информации" Q.

При этом работа деформации Q = L * H, полностью передается рабочим телом (сообщением) от источника к приемнику.

Введенный Шенноном термин "количество информации" крайне неудачен (и, разумеется, не имеет ни малейшего отношения к собственно "информации"), но используется по историческим причинам. Правильно говорить о работе (или энергии) деформации упругой (газ) или квазиупругой (текст) системы.

Обратимый циклический процесс можно рассматривать как упругую деформацию. Исторически, различные технические дисциплины вырабатывали свой собственный взгляд на обратимость и свою собственную терминологию, не считая собственно теории упругости, как раздела механики сплошных сред. Несмотря на различие в деталях, в конечном счете, задача деформации сводится к расчету обратимого перетока энергии по степеням свободы, подобного перетоку частиц в песочных часах ("песочной пружине"). Аналогия с песочными часами позволяет разделить упругие системы на истинно упругие - самостоятельно возвращающиеся в исходное состояние после снятия нагрузки и квазиупругие (гистерезисные) - требующие равных затрат энергии третьих сил как для прямой, так и для обратной ветви цикла. Иными словами, истинно упругие системы содержат собственный накопитель энергии, а квазиупругие системы лишены его. В остальном их поведение идентично.

Для произвольного абстрактного фрактала всегда можно указать по крайней мере два сопряженных измеримых параметра (экстенсор и интенсиал): его геометрический размер и его плотность. Их произведение дает массу (меру) фрактала.

Как показано Шенноном, "количество информации" является инвариантом деформации (сжатия). При этом битовый размер текста отвечает геометрическому размеру фрактала, информационная энтропия - его плотности, а "количество информации" - массе.


Рецензии
Прекрасное введение в предмет – для широкой общественности. Я это уже говорил, теперь хочу просто поздравить. Но на фоне этой публикации термины информатики Шеннона действительно уже не выглядят такими уж удачными. Поскольку это рецензия, позволю себе от имени широкого читателя выразить пожелание чуть подробнее познакомиться с основными терминами, примененными здесь. Для упрощения сформулируем вопрос: какие из них вычисляются, а какие измеряются непосредственно, и как? Понимаю, что следующая публикация автора уже отвечает на этот вопрос – но только частично.
Спасибо. Суважением, Ник.

Ник Пичугин   21.02.2019 17:24     Заявить о нарушении
> вопрос: какие из них вычисляются, а какие измеряются непосредственно, и как?

Фрактальная плотность, в первом приближении, может быть вычислена как обычная (нулевого порядка) информационная энтропия (Шеннона). Здесь, по сути, ничего нового не сказано.

Размер фрактала для сообщения находится непосредственно - это его битовый размер. А вот для текста это, разумеется проблема: необходимо сопоставить две системы (источник и приемник) и найти число различных состояний для общего тезауруса.

Исключая модельные ситуации (конечный автомат, игра типа "морской бой" итп), сделать это, вероятно можно только приближенно. Для текста, например, непонятно как считать размер словаря (например, учет синонимии и омонимии) и как выяснить размер словаря читателя (исключая Эллочку-людоедочку). То есть, сделать это точно можно только для формальных систем с заранее известным и ограниченным набором состояний. Это небольшой, но важный шаг по сравнению с моделью Шеннона.

Пример. Рассмотрим предельно упрощенный вариант игры в "Морской бой" - единственный одноклеточный корабль на игровом поле 10*10. При удаче, он может быть уничтожен первым же выстрелом, в противном случае, полный перебор - 100 клеток - гарантирует уничтожение.

По Шеннону, все эти сообщения различны и различно их (сообщений) "количество информации". Причем, они не дают никакой информации об игре (кроме того, что она завершена).

В предлагаемой модели, можно обычным образом оценить энтропию, а размер фрактала (считая известной карту противника) - ровно два бита (несовпадение предполагаемого и реального расположения корабля). Из чего сразу следует, что, в идеале, игра может быть закончена единственным выстрелом (одной однобитной посылкой).

Иными словами, зная информацию о системе (в смысле предлагаемой модели), можно назвать нижний предел количества однобитовых синхропосылок, необходимого для полной синхронизации.

Так, например, в классическом "Морском бое" суммарная площадь всех кораблей 20 клеток, то есть из сопоставления карт можно сдеать вывод, что 20 выстрелов - минимально необходимое условие победы. Из модели Шеннона этого вывода сделать нельзя.

Инвариант   21.02.2019 22:31   Заявить о нарушении