Хищническая добыча данных, или Почему и как государство должно заботиться об информационной гигиене

565

Публикуется с сокращениями. Полный текст см. в специальном выпуске журнала «Региональная и муниципальная информатизация».

Промышленная разработка данных различной степени персонализации приняла масштаб, позволяющий назвать происходящее цифровой вакханалией. Например, для идентификации пользователя Интернета – даже если он сменит мобильный телефон и компьютер и не возобновит ни одной учётной записи – гарантированно хватит восьми различных геолокационных наблюдений: где и в какое время человек побывал.

Добыча этих данных ведётся у всех на виду, последствия – непредсказуемы, однако почти никого происходящее не тревожит.

Кто и как

Добывают персональную информацию немногие, проблема, однако, в том, что добычей эти немногие готовы делиться (и делятся) со всеми, кто пожелает.

Первыми – по степени близости к персональным данным – среди добытчиков идут владельцы браузерных плагинов. Плагины имеют дело с данными уже после того, как пользователь вошёл в браузер, т.е. шифрование трафика, например, никак не поможет.

Далее – внешний код, загружаемый для обработки браузером. Это счётчики посещаемости (Google Analytics, Яндекс.Метрика, Liveinternet, OpenStat и пр.), кнопки социальных сетей, рекламные си-стемы – все они загружают на ваш компьютер инструкции, исполняемые браузером. Эти инструкции, в свою очередь, загружают другие инструкции – как собственные, так и чужие, чаще всего рекламных систем.

Владельцу сайта не возбраняется и самостоятельно загружать на ваш компьютер код рекламных систем, и вообще любой исполнимый код.

Сайт спортивных новостей «вживляет» в браузер сразу 14 самостоятельных фрагментов исполняемого кода – фактически приложений, о большинстве которых пользователь ничего не знает (данные получены благодаря сервису www.ghostery.com)
Сайт спортивных новостей «вживляет» в браузер сразу 14 самостоятельных фрагментов исполняемого кода – фактически приложений, о большинстве которых пользователь ничего не знает (данные получены благодаря сервису www.ghostery.com)

Сайт, загрузивший на ваш компьютер внешний код, в итоге отправляет собранную информацию на серверы рекламной системы или статистического сервиса, а также оставляет ее в файлах– для себя и для «смежников».

Да, браузер имеет функцию удаления или блокировки cookies, но автор внешнего кода не обязан соблюдать правила – в его распоряжении другие способы сохранить cookies без разрешения. Например, с использованием технологии Adobe Flash. Если ваш браузер, что скорее всего так и есть, несёт на борту вами же установленный плагин Adobe Flash (мощный интерпретатор со своим языком программирования, с его помощью можно много что сделать, причём бесконтрольно), вы никогда не узнаете, что и где о вашем онлайн-поведении за-писано на вашем же диске, и кто эти сведения выкачивает.

Третьими после владельцев браузерных плагинов и хозяев внешнего кода в пищевой цепочке идут провайдеры, как хостинговые, так и магистральные. Провайдер хостинга на своём веб-сервере может устроить собственную ловушку для данных.

Кому выгодно

Данные, собираемые всеми этими способами, нам же и нужны, утверждают владельцы сайтов, счётчиков и рекламных систем – ради правильной («таргетированной») рекламы.

Это неправда. Не пользователю собранные данные предлагают, а посредникам между ним и абстрактными «заинтересантами». Ими могут быть и продавцы услуг и товаров, но вовсе не обязательно – по-средник, собравший сведения о вас, продаст их не только продавцу, а кому угодно. Существует целая высокоразвитая индустрия данных, отчуждённых от интернет-пользователей. Насчитывается 20 тысяч систем, предназначенных для сбора данных о пользователях Интернета.

Но это ещё не проблема. Проблема в том, что в ближайшем будущем нас поджидает ситуация, когда персональные данные – фактически украденные, потому что даже легальные владельцы сервисов, подсовывающие пользователю своё пользовательское соглашение, действуют как воры на доверии – привлекут внимание криминалитета.

Электронный дневник – данные, которые видит (и вводит) родитель, потенциально доступны владельцам двум статистических сервисов и одной рекламной системы – указаны внизу справа
Электронный дневник – данные, которые видит (и вводит) родитель, потенциально доступны владельцам двум статистических сервисов и одной рекламной системы – указаны внизу справа

Способы корыстного использования персональных данных ограничены только фантазией мошенника. Например, деятельность сыскных агентств, чьё благополучие обеспечивают главным образом ревнивые супруги, упростится до последнего предела, стоит только добраться до заботливо собранных статистическими системами пользовательских данных. Ещё пример – электронный дневник вашего ребёнка. Взгляните сами, кто кроме вас следит за его успеваемостью.

Хотите знать, кто еще собирает сведения о вашем имуществе, жилищных условиях, о том, в какую школу или детский сад ходит ваш ребенок? Пожалуйте в личный кабинет московского портала госуслуг — pgu.mos.ru:

Московский портал госуслуг позволяет собирать данные о посетителе счётчику статистики и рекламной сиcтеме
Московский портал госуслуг позволяет собирать данные о посетителе счётчику статистики и рекламной сиcтеме

Как видим, кроме вас ваши данные доступны сервису статистики «Яндекса» и рекламной системе.

Наивно думать, что это не страшно. За сведения о талантливом ребёнке заплатят вузы и работодатели. За сведения о нерадивом – изготовители фальшивых дипломов. И т.д. Маловероятно, что Google.Analytics и Яндекс.Метрика отдадут собранные данные на сторону, они им самим нужны (хотя АНБ не придётся, скорее всего, долго уговаривать Google поделиться сведениями о гражданах РФ), но за рекламные системы ручаться нельзя. Они уже открыто торгуют этими данными.

Отдельная тема – шпионаж. Да, с помощью СОРМ спецслужбы контролируют внутри страны все сколь-нибудь крупные IT-системы. Но СОРМ не обеспечит тотальную, на протяжении всей жизни, слежку за каждым, а именно такая слежка открывает принципиально новые возможности, и дают их массовые IT-сервисы.

Что делать

Прежде всего, следует немедленно усовершенствовать закон. Деятельность сборщиков чужих данных надлежит регламентировать, не дожидаясь жареного петуха, даже если технические средства контроля исполнения такого закона ещё не подоспели. Факт принятия закона создаст условия для их возникновения.

Следует законом или подзаконным актом запретить установку не прошедших сертификацию внешних кодов, чей функционал не может быть проконтролирован, на сайтах органов власти, госучреждений и, возможно, компаний с государственным участием.

Далее – и это тоже задача государства – следует предоставить гражданам надёжные средства личной информационной гигиены. Таким средством должен стать защищённый браузер со встроенной системой блокировки внешних исполнимых кодов. Этот браузер должен быть обязателен для посещения государственных информационных ресурсов – например, сайта госуслуг.

Наконец, необходимо популяризировать средства шифрования трафика, и вообще вести просветительскую работу с населением, 60% которого в нашей стране уже стали пользователями Интернета.

Госайты и не думают защищаться

Существующее положение дел свидетельствует о недопустимой беззаботности разработчиков государственных онлайн-ресурсов – например, на 12% официальных сайтов региональных правительств используется счётчик Google Analytics. Из 84 региональных правительственных сайтов 83 используют счётчики для сбора статистики.

Полные данные об использовании счётчиков (которые, повторим, могут загружать в браузер пользователя исполняемый код) сайтами федеральных, региональных и муниципальных органов власти см. на диаграмме. В анализируемую выборку вошли 324 сайта.

Данные об использовании счётчиков сбора статистики на сайтах государственных органов власти РФ
Данные об использовании счётчиков сбора статистики на сайтах государственных органов власти РФ

Если бы только Интернет

Тему деперсонализации персональных данных и безопасности государственных веб-ресурсов мы лишь обозначили. За пределами изложения остались многие связанные вопросы, такие, в частности, как защита персональных данных на мобильных сервисах и устройствах, а также доступ к пользовательской информации на уровне не веб-сервисов, а настольных операционных систем. Рассмотреть все эти вопросы в од-ном тексте не позволяет объём публикации.

Это, впрочем, и не было нашей целью. Она состояла в том, чтобы аргументированно привлечь внимание к опасности и недопустимости нынешнего положения дел с безопасностью государственных онлайн-ресурсов, о беспечности, с которой их владельцы отдают вовне контроль над сайтами органов власти.

Об авторе: Леонид Филатов, основатель хостинговой компании .masterhost, сервиса статистики Openstat и аналитического сервиса index.ru, директор департамента аналитических систем и статистики государственной поисковой системы «Спутник»

Мнение редакции может не совпадать с мнением авторов, представленных в рубрике «Эксперты»

Полная версия статьи и остальные материалы на тему импортозамещения ПО в органах власти опубликованы в последнем номере журнала “Региональная и муниципальная информатизация” >>>