Информация, база данных и Большие данные

Раздел из второго тома книги "Проблемы изобретательства"

         Авторы Р. Г. Галифанов (Москва) galifanov@gmail.com)
         Р.А. Карлиев (г. Ашхабад, Туркменистан) karliyev@galifire.com)
 
         Авторами – Российским патентным поверенным, управляющим партнером компании «Галифанов, Мальков и партнеры», юристом Р.Г. Галифановым и специалистом по промышленной собственности, магистром в сфере делового администрирования, юристом Р.А. Карлиевым. проанализирована сущность и значение таких понятий, как информация, сведения, сообщения, база данных, Большие данные, право собственности на информацию, характерные особенности размещенной в Интернете информации, темпы ее возрастания и возможность использования информации в качестве товара. Дана формулировка понятия «база данных», показано различие между базой данных и Большими данными, возможность правового регулирования сетевого пространства законодательными нормами и социально-этическими правилами, рассмотрены проблемные вопросы усугубляющегося конфликта между правом на неприкосновенность личной жизни и стремлением пользователей пользоваться преимуществами IT-технологий, а также положительное воздействие информации на развитие интеллектуальной собственности.
         Ключевые слова: информация, база данных, Большие данные, сведения, сообщения, Интернет, собственность, право, объект, персональные данные, обработка, программа, анализ, правила, пользователь.    

Information, Database and Big Data
R. G. Galifanov (Moscow) galifanov@gmail.com)
R.A. Karliyev (Ashgabat, Turkmenistan) karliyev@galifire.com)
          Authors: Russian patent attorney, managing partner of the company “Galifanov, Malkov and Partners lawyer” R.G. Galifanov and industrial property specialist, master of business administration, lawyer R.A. Karliyev. the essence and meaning of such concepts as information, information, messages, database, Big Data, ownership of information, characteristic features of information posted on the Internet, the rate of its increase and the possibility of using information as a product are analyzed. The formulation of the concept of “database” is given, the difference between a database and Big Data is shown, the possibility of legal regulation of the network space by legislative norms and socio-ethical rules is considered, problematic issues of the worsening conflict between the right to privacy and the desire of users to take advantage of IT technologies are considered, and the positive impact of information on the development of intellectual property.
          Keywords: information, database, Big data, information, messages, Internet, property, law, object, personal data, processing, program, analysis, rules, user.

               Информация. Под информацией в общем смысле понимаются знания, полученные из внешнего мира в процессе нашего приспособления к нему, включая  приспособления к нему наших чувств. Характерным свойством информации является ее негэнтропичность - противостояние хаосу, установление порядка, упорядоченности и структурированности знаний. Информация, как таковая, может быть познанной и непознанной. Непознанной является та информация, которая объективно существует, но не перешла в категорию знания, отвоеванного человеком у природы. Эта информация имеет колоссальный объем, ею пронизана, управляется и развивается не только Вселенная, но и сама информация. На фоне непознанной информации объем известной человеку информации представляет исчезающе малую величину и состоит из имеющих на данный момент времени статичный характер сведений, независимо от формы их представления. Другой разновидностью информации являются сообщения, которым в отличие от сведений свойственна динамичность, состоящая в кратковременном обмене ими взаимодействующих субъектов. Кроме того информация, как таковая, подразделяется на базу данных и Большие данные и в зависимости от пределов доступности, может быть, общего доступа (открытая информация), ограниченного доступа (персональные данные, документы для служебного пользования и т.п) и закрытого доступа (засекреченная информация).
              Средства массовой информации, в частности книги, печатные издания, в том числе периодические, например, журналы, газеты, патентные бюллетени сами по себе не являются объектами авторского права, поскольку носят вещный характер в отличие от опубликованных в них произведениях, являющихся объектами авторско-правовой охраны. Издатель печатных изданий не наделяется правом на запрет другим лицам использовать опубликованные в них произведения, если только ему не переданы от автора исключительные права на их воспроизведение и распространение [1].   
            Размещенная в Интернете информация в отличие от опубликованной на бумажных носителях характеризуется изменчивостью, а подчас и исчезновением. Вследствие этого использование ее в качестве различного рода обоснований или доказательств базируется порой на шаткой основе. В частности, в отсутствие нотариально удостоверенного нарушения прав на объект интеллектуальной собственности в Интернете, доказать данный факт будет невозможно в случае ее удаления нарушителем из Интернета. Но и при наличии нотариального удостоверения факта нарушения интеллектуальных прав посредством размещения информации в Интернете истец зачастую не получит компенсационные выплаты за нанесенный ему ущерб, если не докажет факт изготовления, использования или реальных продаж товара нарушителем [2].
            Передаваемые пользователями в Интернет напрямую или опосредованно огромные массивы постоянно нарастающей разнородной информации являются тем материалом, который принято называть Большими данными. Естественно, что эта информация не может не содержать сведения об источниках своего происхождения в персонифицированной или обезличенной форме. Передавая такую информацию во «всемирную паутину», пользователи сами дают согласие на использование принадлежащих им данных, не имея возможности отследить, кто и как будет их использовать.
           Право собственности на информацию распространяется с некоторыми ограничениями в основном на объекты интеллектуальной собственности. Упомянутые ограничение обусловлены переходом некоторых из них (патенты на изобретения, творческие произведения и т.д.) по прошествии определенного времени в общественное достояние. Такие же объекты, как охраняемые в режиме коммерческой тайны секреты производства могут находиться в собственности неопределенно долгое время пока третьими лицами не будет разгадана их сущность или посредством промышленного шпионажа не произойдет их хищение, после чего в большинстве случаев они также перейдут в общественное достояние. Что касается средств индивидуализации владение ими должно периодически подтверждаться оплатой в доход государства соответствующих пошлин, вследствие чего такое владение носит не абсолютный, а относительный характер, поскольку сходно с арендой на определенный срок какой-либо вещи.
         В связи с этим право собственности на интеллектуальную собственность, и тем более на используемый в повседневной жизни огромный массив сведений в его классическом варианте «товар — деньги — товар» малопригоден, а зачастую вообще неприменим для сферы обмена информацией. Так, например, пользователи Интернета получают интересующую их информацию в подавляющем большинстве случаев абсолютно бесплатно. Правовое регулирование сетевого пространства осуществляется преимущественно социально-этическими правилами, выработанные самим Интернет-сообществом, а не законодательными нормами государственного принуждения, несмотря на их наличие. В связи с этим административные попытки отменить или заменить эти правила иными нормативными актами в силу своей нерациональности большей частью неэффективны, поскольку с одной стороны требуется распространять информацию в Интернете, а с другой сохранять в тайне персональные данные пользователей.
          Дело в том, что для размещенной в Интернете информации не существует национальных границ, вследствие чего попытки отдельных государств создать препятствия для ее распространения на своей территории теряют всякий смысл, поскольку имеется множество программных приложений позволяющих зайти на заблокированные провайдером сайты. Вполне естественно, что та информация, которая имеет коммерческую ценность может быть продана нуждающимся в ней лицам в форме оказания информационных услуг или обеспечения доступа к источнику информации, а не в свойственной вещному праву традиционной форме купли-продажи товаров [3]. Это обусловлено тем, что отличие вещного права от права на интеллектуальную собственность состоит в материальности первого (физическое владение реальной вещью) и преимущественно в нематериальности второго (обладание территориально привязанными к различной юрисдикции идеальными объектами, включая результаты творческой деятельности). 
           База данных. Обобщенное определение сущности базы данных на основе приведенных в Википедии сведений можно сформулировать следующим образом. База данных - это представленная в объективной форме совокупность логически связанных сведений в определенной предметной области с описанием их характеристик и взаимоотношений, структурированных исходя из их целевого назначения по определенным правилам с возможностью хранения, быстрого отыскания и обработки посредством ЭВМ для удовлетворения информационных потребностей пользователей. Исходя из данного определения лишь та база данных, которая хранится в памяти ЭВМ может считаться таковой. Другие хранилища информации, пусть даже структурированные определенным образом в определенной области деятельности, например библиотеки, архивы, картотеки не относятся к базам данных. База данных может относиться к любой области деятельности человека, например к предпочтениям посетителей в отношении выбора блюд в предприятиях общественного питания, к оплате абонентами счетов за пользование электричеством, к распределению различных слоев населения по уровню получаемых доходов, к состоянию боеспособности и обеспеченности армии материальными средствами в целом и по родам войск и т.п.
           Любая информационная система, на основе которой принимают управленческие решения, содержит базу данных, которая может иметь самый различный объем. В том же случае, когда ее объем начинает измеряться петабайтами принято говорить о сверхбольшой базе данных. Таковой может быть, например, база данных в отношении распределения населения России по уровню профессионального образования и занятости в различных отраслях экономики.  Права создателя базы данных, как правило, охраняются авторским правом, а права изготовителя базы данных смежными правами и, кроме того на компьютерную программу, посредством которой осуществляется управление базой данных может быть получен патент на изобретение. Добавим также, что авторские (смежные) права распространяются на любые базы данных и программы для ЭВМ, независимо от использованного языка программирования, включая исходный текст и объектный код за исключением, лежащих в основе программ и баз данных идей, концепций, процессов, языков программирования, а также принципов организации интерфейса и алгоритмов.
           Основными свойствами базы данных является простота их получения и обновления, быстродействие, независимость и неизменность структуры от вносимых изменений, безопасность (доступ только для определенного круга лиц), интегрированность (логическая связанность данных) и возможность типизации (использование того типа базы данных, который наиболее соответствует запросам потребителя). Посредством базы данных облегчается решение многих проблем, что особенно важно для крупных компаний, перегруженных огромным объемом различной информации. 
            В области интеллектуальной собственности база данных может относиться к совокупности технических решений в какой-либо отрасли экономики. Так, например, в ВОИС существует База данных PATENTSCOPE обеспечивающая доступ к: опубликованным международным заявкам РСТ, патентным документам и непатентной литературе (любые публикации имеющие отношение к объекту изобретения или промышленного образца). Посредством WIPO Madrid Monitor можно войти в базу данных товарных знаков и провести поиск интересующего обозначения. Соответственно патентные ведомства также имеют свою базу данных по различным объектам интеллектуальной собственности. Например, база данных Роспатента содержит сведения о российских и иностранных изобретениях, о полезных моделях, зарегистрированных товарных знаках и т.д. База данных Linkmark.ru позволяет осуществить бесплатный онлайн поиск по всем получившим охрану в России товарным знакам. Упомянутые базы данных содержат упорядоченную информацию, обработанную с использованием специализированных компьютерных программ, что облегчает их использование.
            Большие данные. Базы данных следует отличать от Больших данных, не являющихся объектом какого-либо права и характеризующихся такими свойствами, как разнообразие, высокая скорость поступления и чрезвычайно большой объем структурированных и неструктурированных сведений. В последнее время к этим свойствам добавились также достоверность, изменчивость и ценность приводимой в Больших данных информации [4]. Для обработки Больших данных обычные программные методы и аппаратные средства либо нерациональны, либо вообще неприменимы, вследствие чего для этой цели используются специальные аппаратно-программные комплексы, обеспечивающие высокопроизводительный анализ целевой информации в онлайн-режиме. Благодаря использованию высокопроизводительных грид-вычислений посредством множества совместно работающих компьютеров, либо запросам данных из оперативной памяти (RAM), компании применительно к своим задачам могут обрабатывать любые объемы Больших данных. Причем для ускорения вычислений иногда их сначала структурируют, отбирая только те, что нужны для обработки и анализа. Результаты такой обработки крайне важны для развития экономики в нужном направлении, поскольку позволяют принять правильные управленческие решения в области создания новых продуктов и увеличения конкурентоспособности производимых товаров.               
            Основным источником Больших данных является любая информация в Интернете за исключением персональных данных, в том числе Интернет вещей, социальные медиа, корпоративная информация, показания приборов объединенных общностью стоимостных затрат и иных взаимосвязей.  Результаты обработки Больших данных используют для выяснения причин и закономерностей успехов или неудач в той или иной сфере, для прогноза наиболее вероятностного развития событий, выявления проблем в любой области деятельности и путей их предотвращения, а также анализа причин происходящих событий. В наши дни Интернет вошел во все сферы повседневной жизни, с его помощью осуществляется электронная торговля, работают поисковые сервисы, социальные сети, функционируют планшеты и смартфоны. Соответственно неимоверно быстрыми темпами увеличивается объем используемой и нарождающейся новой информации.
            В частности, если в 2017 г.  объем хранящейся в памяти электронных устройств информации составлял 16,2 зеттабайта, то по прогнозам к 2025 г. он возрастет до 163,0 зеттабайтов, причем большинство этой информации будет сгенерировано не людьми, а взаимодействующими между собой электронными устройствами посредством их цифровой идентификации, привязанной к Базам данных, лежащей в основе «Интернета вещей».  Следует отметить, что предоставляемые Большими данными возможности снижают в определенной мере эффективность принятого в большинстве стран мира законодательства о защите персональных данных, поскольку вторгаются до некоторой степени в права людей на частную жизнь и тем самым устраняют существующие ограничения в этой сфере, независимо от того дано или нет субъектом согласие на обработку его данных.
           В этих условиях для минимизации причинения вреда гражданам в результате утечки персональных данных используется их анонимизация посредством декомпозиции, перемешивания, изменения семантики и ряда других способов. Вместе с тем, чем выше степень анонимизации сведений, тем меньшую ценность они представляют для обработки и анализа и, следовательно для потребителей. Это, в свою очередь означает необходимость изыскания таких способов защиты персональных данных, при которых использование Больших данных любого объема исключает вторжение в частную жизнь граждан, поскольку действующее законодательство о персональных данных в современную эпоху все меньше отвечает предъявляемым к ним охранным требованиям [5].
           Согласно имеющимся данным почти все браузеры в открытой или скрытой форме (Edge, Firefox, Opera, Yandex) собирают информацию о своих пользователях. Наиболее активным в этом отношении является Яндекс. При первом же запуске он устанавливает десятки подключений, многие из которых ведут на серверы компаний, с которыми Яндекс поддерживает партнерские отношения (Mail.ru, В контакте и даже Google), причем самые подробные сведения направляются на адрес api.browser.yandex.ru, одновременно сохраняясь в заархивированном виде (all_zip_2) в загрузках (папка Compressed). Общий объем этих ежедневно скачиваемых сведений, согласно имеющимся данным составляет 583 кб, По приведенной в Интернете информации они представляют собой набор технических сведений (разрешение экрана, общая архитектура процессора, количество открытых вкладок, паролей, физическое местоположение устройства, в какой среде запущен браузер - виртуальной или реальной). Возможно, что Яндекс замаскированно отслеживает помимо указанных ряд других действий пользователя на компьютере, нарушая тем самым законодательство о защите персональной информации, но пока это бездоказательное предположение, хотя основания для этого имеются, тем более что в браузере Яндекс не предусмотрена возможность отключения отправки упомянутых данных на сервера компании и ее партнеров [6]. В связи с вышеизложенным охрана персональных данных, так или иначе, попадающих в состав Больших данных приобретает особую актуальность, поскольку никто из нас не желает вторжения в личную жизнь, кого бы то ни было. 
          Между тем конфликт между правом на неприкосновенность личной жизни и стремлением пользоваться преимуществами IT-технологий продолжает усугубляться, поскольку пользователи компьютерной сети лишены возможности контролировать в ней оборот информации о себе, включая ее удаление или изменение, в связи с чем не могут предугадать как их данные будут собираться, храниться и использоваться. Это обусловлено периодическим изменением политики конфиденциальности в сфере охраны прав на личную жизнь, а также тем, что большинство компаний включают оговорку о возможности одностороннего изменения этой политики. В связи с этим Большие данные все в большей степени рассматриваются поисковыми сервисами, мессенджерами и социальными сетями в качестве, хотя и остающегося в тени, но существенного источника прибыли за счет их продажи различным компаниям. Законодатель же игнорирует данный источник прибыли, не будучи в состоянии законодательно урегулировать Большие данные. К тому же крупные корпорации заинтересованы в существовании открытого Интернета, не скованного жестким регулированием ограничивающего их развитие. По этой причине они являются активными противниками законодательного урегулирования Больших данных, в которой конфиденциальность рассматривается, прежде всего, в качестве товара [7]. 
          В США, например, Федеральная Торговая Комиссия нацеливает Штаты и компании на самостоятельную выработку правил конфиденциальности в использовании Больших данных, укрепляя тем самым веру законодателя в возможность их саморегулирования. Однако следует признать, что ввиду применения различных дефиниций в многочисленных правилах, частное лицо не может предугадать, как его данные будут использованы, и в частности, не приведут ли они к посягательствам на его частную жизнь.
         Применительно к интеллектуальной собственности ценность анализа результатов Больших данных состоит в их способности вызывать творческие ассоциации и наталкивать на продуктивные технические и социальные решения проблем в различных областях деятельности человека, например вследствие нахождения сходных свойств, характеристик, особенностей в разнородных процессах, а также взаимосвязей между ними. Следует отметить, что перспективы развития технической и социальной мысли посредством обработки Больших данных пока малоисследованы, но то, что со временем они станут мощным катализатором общественно-политических и технико-технологических изменений в жизни общества сомневаться не приходится.

                Использованная литература:

1.  Городов О.А. О юридической модели средства массовой информации // Патенты и лицензии. Интеллектуальные права. № 11, 2020. С. 15-23
2.  Петровская Е.В. Использование архивной информации из Интернета в работе патентного поверенного  // Патентный поверенный, № 5, 2017
3. Войниканис Е.А., Якушев М.В. Информация. Собственность. Интернет: Традиция и новеллы в современном праве. - М.: Волтерс Клувер, 2004.
4. Клейменова Л., Зуйкова А. Что такое Big Data и почему их называют «новой нефтью» // 5. Шайдуллина В.К. Большие данные и защита персональных данных: основные проблемы теории и практики правового регулирования // Общество: политика, экономика, право // № 66(1) – 2019. С. 51-55
6.  SPY-SOFT.NET // Слежка в Яндекс Браузер // Spysoft.net/slezhka-yandex-browser
7. Соснин К.А., Правовое регулирование Больших данных: зарубежный и отечественный опыт // Журнал Суда по интеллектуальным правам, № 25, сентябрь 2019 г., С. 30-42


Рецензии