Пару слов о статистической лингвистике в художеств

Пару слов о статистической лингвистике в художественном тексте

Если проанализировать частотность слов русскоязычного перевода евангелия от Марка, то из 11371 слова со стоп-словами и 5739 слов без стоп-слов наиболее часто встречаются глаголы, обозначающие процесс говорения.
Сказать – 141;
Говорить – 141;
Спросить – 26;
Ответить -57;
Просить – 14;
Повелеть - 5;
Призвать – 5;
Подозвать -4;
Благословить – 3;
Вскричать – 3;
Возгласить – 2;
Восклицать – 2;
Закричать – 2;
Приказать -2;
Рассказывать – 2;
Слово(слова) - 21;
 И получается, что около 7.5 %(432) слов  относится к  речи.
А слова Иисус - 95 , Христос – 6, сын - 23, Бог- 22
Можно ли по статистике частоты слов сказать что-нибудь существенное о тексте? Весьма сомнительно. Разве что в тексте много говорят и кто и о ком больше говорят. Вообще говоря, художественный текст - это метафора, где смысл текста не выражается прямым значением слова и следовательно статистика здесь бессильна.
Хотя можно возразить и привести слова евангелиста Иоанна, что «В начале было слово и слово было у бога и слово было бог» и сказать, что в данном случае статистика частоты глаголов речи как раз и выражает сущность евангелия как воплощенного Слова Бога.
Допустим, что здесь есть некоторое совпадение статистики со смыслом, но в остальных многих случаях найти его вряд ли удастся. Возьмем, например, притчи Франца Кафки.



«О притчах
Многие сетуют на то, что слова мудрецов — это каждый раз всего лишь притчи, но неприменимые в обыденной жизни, а у нас только она и есть. Когда мудрец говорит: «Перейди туда», — он не имеет в виду некоего перехода на другую сторону, каковой еще можно выполнить, если результат стоит того, нет, он имеет в виду какое-то мифическое «там», которого мы не знаем, определить которое точнее и он не в силах и которое здесь нам, стало быть, ничем не может помочь. Все эти притчи только и означают, в сущности, что непостижимое непостижимо, а это мы и так знали. Бьемся мы каждодневно, однако, совсем над другим.
В ответ на это один сказал: «Почему вы сопротивляетесь? Если бы вы следовали притчам, вы сами стали бы притчами и тем самым освободились бы от каждодневных усилий».
Другой сказал: «Готов поспорить, что и это притча».
Первый сказал: «Ты выиграл».
Второй сказал: «Но, к сожалению, только в притче».
Первый сказал: «Нет, в действительности; в притче ты проиграл».
У Кафки 160 стоп-слов и 71 слово без стоп-слов.
Притча-8;
Сказать-5;
Говорить-2;
Из 71 слова – 15 слов, почти 20% относятся к речи. Частотность речи даже выше , чем в евангелии от Марка.
Остальные почти все слова употребляются Кафкой по одному-два раза, то есть тошнотность текста Кафки очень маленькая. Притча –это, по - существу, тоже речь, слова. И в притче Кафки и в евангелии, и в остальных трех евангелиях частотность слов речи тоже очень высокая .
Евангелие от Иоанна:15342-с стоп-словами,7216- без стоп-слов. Глаголы речи-600, Иисус- 250.
Евангелие от Луки:19394-стоп-слова,9701-без стоп-слов. Глаголы речи-500,Иисус-100.
Евангелие от Матфея:18081-стоп-словами,без стоп-слов-9301.Глаголы речи-450,Иисус-170.
Только далеко  не всякий скажет, что евангелия  и притча Кафки об одном и том же.

Von den Gleichnissen
Viele beklagen sich, da; die Worte der Weisen immer wieder nur Gleichnisse seien, aber unverwendbar im t;glichen Leben, und nur dieses allein haben wir. Wenn der Weise sagt: »Gehe hin;ber«, so meint er nicht, da; man auf die andere Seite hin;bergehen solle, was man immerhin noch leisten k;nnte, wenn das Ergebnis des Weges wert w;re, sondern er meint irgendein sagenhaftes Dr;ben, etwas, das wir nicht kennen, das auch von ihm nicht n;her zu bezeichnen ist und das uns also hier gar nichts helfen kann. Alle diese Gleichnisse wollen eigentlich nur sagen, da; das Unfa;bare unfa;bar ist, und das haben wir gewu;t. Aber das, womit wir uns jeden Tag abm;hen, sind andere Dinge.
Darauf sagte einer: »Warum wehrt ihr euch? W;rdet ihr den Gleichnissen folgen, dann w;ret ihr selbst Gleichnisse geworden und damit schon der t;glichen M;he frei.«
Ein anderer sagte: »Ich wette, da; auch das ein Gleichnis ist.«
Der erste sagte: »Du hast gewonnen.«
Der zweite sagte: »Aber leider nur im Gleichnis.

Der erste sagte: »Nein, in Wirklichkeit; im Gleichnis hast du verloren

Напоследок для любопытных привел выше немецкий текст Кафковской притчи. Там
Gleichnissen(притчи) – 8;
Sagen(сказать) – 7;


18.02.15


Рецензии
Алексей, привет! Что можно сказать о тексте по частотности слов....? Первично слово, вторично число.Текст - спонтанный акт. Самая высокая частотность быть может в акафистах...Почему? Нумерология по отношению к сознанию темная вещь, практически не изученная. Если мы что и понимает иногда, то как краткое озарение. Интересно другое....воздействие того или иного текста на психику, а может и на судьбу, что по сути дело Бога.

Элла Левкина   23.02.2015 23:16     Заявить о нарушении
Привет, Элла! Математизация социальных наук , наверное, имеет границы, если, фигурально выражаясь, нельзя все разложить на кванты и придать этому всему функциональную зависимость. А почему нельзя , если все конечно? Все конечное возможно, вероятно, математизировать хотя бы в вероятностных понятиях и нечеткой логике. В этом смысле и слово и число имеют значение элементов одного множества, под названием семиотическое или формальных языков и грамматик. Воздействие на психику относится к психолингвистике и когнитивной лингвистике. Кстати, звук тоже относится к семиотике , наряду со словом и числом. Поверить алгеброй гармонию мира пытался еще Пифагор. А сейчас современная наука.
Что касается влияния текста на судьбу и психику, то очень редко какой-то один текст влияет. В основном какая-то культура.
Как сказал Эйнштейно о свободе воли, процитиров классика, что воля свободна, а вот воля воли уже нет.


Селадьин Алексей Владимирович   24.02.2015 01:05   Заявить о нарушении
Есть ли у судьбы судьба?)

Элла Левкина   25.02.2015 16:02   Заявить о нарушении
Под судьбой судьбы обычно понимают Бога. Как причину причин и форму форм. Но это если мыслить как последовательность причин приводящих к одному действию. Но если взять к примеру того же Эйнштейна, то вообще говоря, если нет временной и пространственной точки отсчета, а пространство и время относительны, то нет и единой последовательности причин , приводящих к одному действию. Это , кстати, разрушает всю теологию(богословие) доказывающее единобожие и вообще существование бога. Люди того времени мыслили эвклидовым пространством с гауссовой нулевой кривизной и абсолютным временем, поэтому и строили такие логические суждения.

Селадьин Алексей Владимирович   25.02.2015 17:36   Заявить о нарушении