И ЕЩЁ РАЗ. Новая машинопись

                НОВАЯ МАШИНОПИСЬ
___________________________________________________________


           26.08.08.

                И ЕЩЁ РАЗ
 

Все или почти все буквы, кроме согласных, и какая-то часть согласных, надеюсь, почти очевидны в тексте, и вот они уже быстро разгаданы.

Как разгадывать остальные буквы с помощью компьютера? На каких приёмах дешифрования «ольшаницы» могут быть созданы для него какие-то программы? Насколько мало можно будет указывать в словах их буквы в конкретном значении, не шифром?

 

Ищем бесспорные разгадки чего-нибудь, - накапливаем такие подсказки.

Обращаем внимание на дефисы и находим:

Частицы: ТО, ЛИБО, НИБУДЬ, КОЕ, ТАКИ, КА – по большей части сразу  со вторым словом, что пишется с ними через дефис.

Предлоги: ИЗ-ЗА, ИЗ-ПОД.

Вводные слова: ПО-ВИДИМОМУ, ПО-ПРЕЖНЕМУ, ПО-ПУСТОМУ

Некоторые прочие слова, следующие из текста: ПО-РУССКИ, ПО-АНГЛИЙСКИ.

Числительные: ВО-ПЕРВЫХ, ВО-ВТОРЫХ, и т.д. Вообще ЛЮБЫЕ ЧИСЛИТЕЛЬНЫЕ В ЛЮБОЙ ГРАММАТИЧЕСКОЙ ФОРМЕ имеют бесспорное прочтение и чётко указывают грамматическую форму слов, с ними взаимосвязанных.

 

Обращаем внимание на апострофы и находим все И в начале слова, а в конце слова после гласной - И или Й, а после согласной - Ъ, Ь, И, или Ы. Тут же они уточнятся вместе с грамматической формой этих слов и других слов, взаимосвязанных с ними. Предположения стоит начинать с вариантов: И, Ъ.

 

Находим местоимения и быстро разбираемся, - какие именно: Я, ТЫ, ОН, ОНА, ОНИ, МЫ, ВЫ, МЕНЯ, МНЕ, МНОЙ, МНОЮ, ОБО МНЕ, ОН, ЕГО, У ЕГО, У НЕГО, ЕМУ, К НИМ, С НИМ, К НИМ, О НЁМ, ЕЙ, ЕЁ, ЕЮ,  У НЕЁ, С НЕЮ и т.д. Пожалуй, почти все местоимения во всех формах очевидны или почти очевидны.

 

Быстро распознаются почти все слова из большинства частей речи:

·        междометий,

·        частиц,

·        союзов,

·        предлогов,

·        наречий,

·        местоимений,

·        числительных.

 

Числительные любые вообще опознаются без разночтений.

Слова из остальных перечисленных выше частей речи подсказываются всеми буквами этих слов, кроме согласных, да и напрашивающимися согласными, и взаимосвязями с другими словами по тексту.

Из десяти частей речи сложнее всего может оказаться разгадывание некоторых существительных и, в меньшей степени, глаголов, а также

немногих из имён прилагательных. Займёмся теми из них словами, что легче разгадываются. Корней глаголов в тексте какой-то тематики, совсем не много, и они часто повторяются. Глаголы, в основном имеют чисто русские корни. Эти слова легко разгадываются. По сюжету и слогу построения фраз они как бы напрашиваются само собой.

___

 

В орфографический словарь языка Великого и Могучего патриотичные специалисты набросали для ровного счёта аж 100.000 слов, в основном, иноязычных, мало кому известных терминов, редко употребляемых, и длиннющих производных от куда меньшего числа корней, в основном, не русских.

Будучи в своё время пламенными ленинцами, эти партейные учёные насчитали в лексике вождя аж 40.000 слов, - в два раза больше, чем аж 20.000 слов у величайшего поэта России, – «Нашего всё». Между временами  Пушкина и Ленина прошло столетие. Уже за тот период усердные профессора добавили в словари языка Великого и Могучего   какое-то число десятков тысяч слов: всяческих узко специальных терминов, прочих иностранных слов, которые в большинстве своём по сей день мало кому известны, и прочих слов, всё более длиннющых (этих неисчислимых производных от весьма немногих русских корней).

 

Сам геноссе Макс Фасмер, не безызвестный фашист,  работая на   нацистскую службу идеологической пропаганды (судя по его полномочиям в Германии тех лет, - уж не по заданию ли самого фюрера?), к середине 20-го века во всевозможных словарях и специфичных словариках изыскал всего в русском языке 18000 слов. Демонстрируя, в основном, свою эрундицию,  тот престарелый пижон постарался набросать в свой тяжёлый 4-х-томник «Этимологический словарь русского языка» как можно больше – тысячи – теперь уже вряд ли кому известных, диалектных слов.  Они уже сотни лет как   забыты, даже там, где только и были когда-то хотя бы лишь разок кем-то услышаны и записаны, - в каких-нибудь самых глухих губерниях во времена царя Гороха. 

 

 

Пётр Черных набросал в свой «Историко-этимологический словарь»

13560 слов, «включая, новые  иностранные слова в белорусском языке, болгарском и т.д.» (О.Н.Трубачёв). Ещё раз подчеркнём, что в словаре «истрико-этимологическом», понятное дело, особо много внимания уделено словам забытым, диалектным, канувшим в глухую историю русского языка.

 

На основании этого можно предположить наличие в современном русском языке, действительно Великом и Могучем, пожалуй, самом гибком и перспективном языке в мире, не более 10000 литературных слов, ныне всем знакомых и достаточно активно используемых в печати. Число это весьма условно, поскольку даже из одного корня можно производить почти неограниченное число производных слов.

Слово-то может иметь и два окончания, и две-три приставки, и три-четыре суффикса, и даже два-три корня. А их многообразие в языке Великом и Могучем - во какое!

 

Но с другой стороны, в 10-ти тысячах производных слов - сколько их исходных корней, разных, исконно русских, можно было бы насчитать? Компьютер это может сделать мгновенно, но не в моих руках.  Не решаюсь предположить какое-то число. Известно, однако, что эти корни составляют очень малое число самого ядра основного фонда в словарном составе русского языка.  Значительная часть этого числа корней является этимологическими производными от еще меньшего числа этих же корней. Я уже приводил примеры. Самые древние корни и составные части самых употребляемых слов имеют лишь по одной или две согласные. В этих словах, если их зашифровать ольшаницей, все буквы, кроме согласных служат подсказками. Да и не все согласные алфавита, и далеко не любые сочетания двух любых согласных типичны для русских корней.

Короче говоря, число вариантов не велико.

 

И вот представим, что большая часть слов в тексте уже разгадана. В еще не расшифрованных, уже очень не многих словах понятны и приставки, и окончания, и суффиксы, но шифровки корней пока допускают какие-то разночтения. Надо выбрать подходящий вариант из какого-то числа существующих слов, подпадающих под одну и ту же шифровку. Проще это сделать в глаголе или в имени прилагательном, чем в имени существительном. Человек может мыслить по-человечески, не так как запрограммирован компьютер. Нас же интересуют приёмы для программирования компьютера, читающего текст, зашифрованный «ольшаницей».  Найти слово, которое является глаголом среди прочих слов шифровки, - не вопрос. Не проблема – прочесть в шифровке глагола его окончание, приставку и суффикс.   Корень такого глагола, предположим, допускает разночтения. Слово это впервые упоминалось и явными буквами, но предположим, что упоминались явными буквами и другие слова, подпадающие по ту же шифровку.

Теперь для решения таких загадок делаем ставку на быстродействие компьютеров, тем более на быстродействие компьютеров уже самого ближайшего будущего.  Господа «учёные» всё же окажутся вынужденными признать необходимость шифра «ольшаница», не смотря на сегодняшнее (см. «Началось!») отношение горе-академиков к такой перспективе.

 

Пусть компьютер, перебирая несколько вариантов прочтения шифровки глагола, не умея соображать по-человечьи, быстренько поищет:

а существуют ли где-нибудь сочетания каждого из проверяемых глаголов в сочетании с теми же словами, что и в данной фразе, и в других фразах всего текста? Возможно, проверяемого варианта компьютер нигде в литературе не найдёт, или найдёт, что такое словосочетание встречается слишком редко. Тогда в списке слов, кандидатов на место правильного слова во фразе, проверяемое слово опустится по степени приоритетов. Сравнение количественных результатов таких проверок каждого варианта определяет порядок приоритетов в последовательности проверяемых слов на их испытание всеми возможными приёмами. Когда неразгаданных слов, а точнее, их корней, в тексте останется очень мало, то станут более оправданы проверки на существование в литературе предполагаемых словосочетаний.

Может оказаться, что предполагаемый глагол нигде не встречается с таким-то наречием или с таким-то именем существительным. Словосочетание одного из предполагаемых имён прилагательных с таким-то существительным может оказаться нигде не найденным, и это усиливает сомнение в правильности такого варианта, и, наоборот, заостряет подозрение на варианте ином.

 

Если шифровка слова допускает какие-то разночтения в каком-то месте текста. Отбросить неподходящий вариант может помочь поиск этой слова предполагаемой расшифровки по всему тексту. Разные слова одинаковой шифровки в каком-то их падеже, могут оказаться под разными шифровками в ином их падеже или в иной какой-то грамматической форме слова. Обнаруженная неувязка по тексту покажет на не подходящий из вариантов.

 

В тексте такой-то тематики повторяются одни и те же слова этой тематики. Не только в начале текста разгадка какого-либо слова подсказывает многое. При работе с компьютером нет неудобства в том, что слово разгадывается лишь где-нибудь хоть в конце текста.

 

Существуют обратные словари. Для компьютерного дешифрования они могут быть особенно полезны. По окончаниям  определяется грамматическая форма  слов и строй предложения.

Прочитав окончания, компьютер избавляет себя от разгадывания слов из иных частей речи и в других грамматических формах. Отбросив слова с иным числом букв, с иными приставками и с иными суффиксами, программа оставит себе лишь заботу разгадать корень. В нем лишь одна, две или три согласные – как правило, не любые. Остальные служат подсказками. Они или очевидны,  или почти все очевидны из ситуации.

Самые короткие слова, если не очевидны, то сразу определяются перебором очень небольшого числа вариантов.

Длинные слова труднее было бы разгадывать путём перебора вариантов, которых должно быть много лишь из соображений только арифметики. На самом же деле, шифровки длинные слов или длинных частей слова, даже заимствованных из других языков, не имеют много предварительных разночтений.

 

Мы насчитали реальных 10000 достаточно часто употребляемых слов в современной русской речи. Многие ли из них имеют такое-то число букв? Почти все слова, за исключением нескольких, всё время повторяющихся нескольких терминов конкретного текста такой-то темы имеют длину, положим, до 12 букв. А многие ли из них имеют длину, например, именно в 11 или в 7 букв? А многие ли из слов именно такой-то длины относятся именно к словам такой-то части речи? Скажем, из пары десятков грамматических форм, существующих у этой части речи, много ли остаётся вариантов для именно такой-то из них. Да и вообще, много ли вариантов останется после сверки по каждому знаку данной шифровки с шифровками всех пока еще не отпавших вариантов из слов всего словаря, объёмом не в 100000 тысяч, а лишь 10000 слов?!  Под какое число шифровок подпадают эти, всего лишь десять тысяч слов?! Сколько слов подпадает под одну такую шифровку в типичном случае?!

Числа вовсе не оказываются пугающими.

Не разгадывая каждую согласную в этих, не слишком многих буквосочетаниях, отбросим или, наоборот, прежде других примем к проверке шифровки с какими-то особыми приметами. Не занимаясь ещё разгадкой каждого знака в шифровке, можно обратить внимание на какое-то характерное сочетание четырёх или трёх, или двух таких то знаков на таком-то месте среди такого-то числа знаков в шифровке слова.

Короче, хотя для компьютера не помеха большие числа проверяемых вариантов, ему можно оставить лишь ничтожную часть и такой дурной работы.

 

Если и возможны случаи, что какие-то слова в тексте, полностью зашифрованном «ольшаницей»  компьютер всё же так и не сможет разгадать, то это будет ничтожный процент текста.

Но ведь здесь сейчас рассматривалась дурная, абстрактная сверхзадача. Компьютеру в этой статье давался текст, в котором шифрованные слова не задавались в первых их упоминаниях явными, конкретными значениями букв.

 

 Приёмами решения упомянутой здесь «дурной сверхзадачи» показывается то, что, набирая текст, например, способом «напёрстки» не стоит очень-то опасаться того, что какие-то слова компьютер не сможет разгадать, если они не были упомянуты первоначально конкретным указанием каждой буквы.

 

Мне самому хотелось лучше убедиться в том, что текст заданный даже всего лишь тремя знаками вместо 33-х буквенных знаков русского алфавита, вполне поддаётся мгновенной расшифровке компьютером.

 

Зачем это нужно, декларировалось и объяснялось в других моих публикациях на эту тему, например, в интернетовской  статье  НОВАЯ МАШИНОПИСЬ.


Рецензии