Минобороны США делает поисковик для Dark Web

1732

Предлагаем вашему вниманию сокращенный перевод статьи Wired.

Управление перспективных исследовательских проектов министерства обороны США (Defence Advanced Research Project Agency, DARPA) разрабатывает поисковую машину, которая осветит «тёмную сторону» Интернета и поможет органам правопорядка отслеживать противозаконную активность.

Проект, получивший название Memex, уже несколько лет разрабатывается 17-ю различными командами по заказу DARPA. В отличие от поисковиков Google и Bing, которые ищут среди ресурсов, пользующихся популярностью, и поэтому охватывают порядка 5% Интернета, Memex должен уметь находить данные, которые их владельцы, напротив, тщательно скрывают.

Для этого Memex будет исследовать не только содержание сайтов, не пользующихся популярностью, но и прочесывать тысячи ресурсов, расположенных в зоне так называемого темного Интернета (Dark Web). Примером ресурса Dark Web может служить подпольный онлайн-магазин наркотиков и оружия Silk Road,  долгое время функционировавший в анонимной сети Tor.

Сайты Dark Web доступны лишь при помощи браузера Tor, и попасть на них можно, только если знать точный адрес ресурса. И хотя на некоторых открытых сайтах существуют частичные списки тайных адресов, а также имеется специальный поисковик Grams, ищущий сайты, связанные с криминалом, большинство незаконных Tor-ресурсов остаются вне зоны видимости.

Одна из задач проекта Memex, говорят его разработчики – выяснить, какой объем трафика в Tor-сетях генерируется противозаконными сайтами. Предполагается, что в «луковой сети» (ресурсы Dark Web находятся в официально не существующей зоне .onion, отсюда и название – ред.) может быть расположено 30-40 тысяч ресурсов с противоправным контентом (там можно, например, заказать преступление – вплоть до убийства, — ред.). И они не индексируются обычными поисковиками.

Memex, во-первых, должен сделать содержимое Tor-ресурсов доступным для обнаружения, а во-вторых, обнаружить связи между ними и теми, кто этими ресурсами пользуется. Разработанные для Memex алгоритмы могут впоследствии применяться в различных областях, помогая правоохранительным организациям, военным и частным компаниям. По словам разработчиков, сейчас с проектом Memex сотрудничают четыре партнера, которые участвуют в тестировании и внедрении прототипов. Так, наработки поисковика уже используются для обнаружения сайтов, подозреваемых в причастности к торговле людьми. Эти же механизмы могут быть использованы для фиксирования вспышек заболеваний Эбола или для любого объекта исследований, порождающего поток онлайн-контента, который нельзя заметить, если искать точечно, не анализируя неочевидные связи между сетевой активностью и иными событиями.

Как пояснил менеджер проекта доктор Крис Уайт (Chris White), Memex отслеживает характер работы IP-адресов, активность телефонных номеров, адреса, указанные в рекламных объявлениях, геоданные устройств, с которых объявления отправлялись, и т.д.

Уайт не назвал точной стоимости Memex, но сказал, что она сопоставима с бюджетами на другие проекты, связанные с обработкой и анализом данных — порядка 10-20 миллионов долларов.

Дополнительно:

Memex (от англ. memory и index) — наименование гипотетического прототипа гипертекстовой системы, описанной Вэниваром Бушем в эссе «Как мы можем мыслить», опубликованном в журнале The Atlantic в 1945 году.

Буш изобразил мемекс как устройство, в котором человек сможет хранить свои книги, записи и контакты, и которое «выдаёт нужную информацию с достаточной скоростью и гибкостью». Мемекс позволял бы существенно расширить и дополнить возможности памяти человека. Концепция мемекса оказала большое влияние на разработку ранних гипертекстовых систем (что в итоге привело к созданию всемирной паутины) и персональных баз знаний.

Чтобы не пропустить самое интересное, читайте нас в Телеграм

Поделиться: