Размышления. Тряпочка имеется

Размышления | Профессиональный снобизм. Тряпочка имеется

Если вам когда-либо доводилось переводить фразы, предложения, статьи, книги с родного языка на иностранный, проблема контекста должна быть знакома.

У слова, как известно, может быть несколько значений. У фразы — ещё больше. На каком остановиться, чтобы не попасть впросак? То же самое и при переводе на родной язык. Хотим мы или нет, но надо понимать то языковое окружение, в котором употребляются слова.

Иными словами, учитывать контекст. Обычно различают узкий контекст ("микроконтекст", контекст предложения) и широкий контекст ("макроконтекст", смежные предложения, абзац, глава и т.д.).

Когда контекст мы формируем сами (пишем на иностранном языке), ситуация усложняется: с чем это сопоставлять?

Один из полезных приёмов (помимо эталонных толковых словарей) — смотреть, как ваш вариант и в каких контекстах уже используется. Делаем просто запрос в Google и анализируем результат выдачи.

Что интересно, нечто подобное можно применять и по отношению к родному языку. Понимаю, что многие считают себя непревзойдёнными экспертами (в т.ч. дипломированные лингвисты и филологи), но учиться, полагаю, никогда не поздно.

Как и время от времени сбивать с себя спесь всезнайки, тот профессиональный снобизм, который особенно расцветает в эпоху доминирования социальных сетей. Увы, мы ОЧЕНЬ многого не знаем. Не только рядовые граждане, но и профи.

Так вот, есть такой замечательный ресурс: Национальный корпус русского языка (НКРЯ, ruscorpora.ru). Появился он достаточно давно (открыт с апреля 2004 г.), хотя работы были инициированы ещё в 2001 г.

Что это такое? Большой онлайн-корпус русских текстов: свыше 350 тыс. текстов, порядка 322 млн словоупотреблений (основной корпус, в газетном – 305 млн, в поэтическом — 12,4 млн). Отобраны и проиндексированы значимые материалы, далеко не только классика русской словесности.

Тексты там художественные и нехудожественные. Есть даже церковнославянские и древнерусские (вкл. берестяные грамоты, жития святых, законодательный свод “Русская Правда”). Можно задавать жанры, типы, тематики, годы создания, годы рождения авторов и т.п. Есть и Устный корпус (живая речь).

Исходя из этих параметров имеется возможность задать подкорпус (зону поиска), в котором уже делать необходимые запросы. В выдаче будут фрагменты произведений с указанием необходимых реквизитов (автор, название, год).

Ну а сам текст (вне фрагмента), разумеется, надо уже потом искать (напр. через обычные поисковики).

Помимо этого есть двуязычные пары (параллельный корпус) для русского (английский, немецкий, французский, испанский, китайский и др.).

Кто создавал и кто курирует этот проект (помимо собственно Яндекса):

• Институт русского языка имени В.В.Виноградова РАН (ИРЯ РАН).
• Институт языкознания РАН (ИЯз РАН).
• Институт проблем передачи информации имени А.А.Харкевича РАН (ИППИ РАН).
• Институт лингвистических исследований РАН (ИЛИ РАН) в Санкт-Петербурге (совместно с Санкт-Петербургским государственным университетом (СПбГУ)).
• Воронежский государственный университет.

Весьма мощный инструмент, хотя по своему опыту скажу, что полнота (лично для меня) пока маловата. Но работать можно. Рекомендую.

На чём проверить?  Одна из "забав": графики распределения частоты использования слова (по годам).

Но можно и поработать со стереотипами восприятия. Возьмите хотя бы слова "кофе" и "одеть". Которыми так любят кичиться некоторые ригористы, воинствующие ревнители чистоты русского языка, распространяя это и на прошлое, и на будущее.

Тут недавно один шибко умный товарищ возмущался Михаилом Булгаковым и Львом Толстым. Мол, с ошибками писали господа. Недалёкие...

Знаете, полезно иногда в архивах порыться и свои очки познания немного протереть. Тем более, тряпочка под рукой имеется.


Рецензии