Об американских разведывательных программах анализа медийной информации

Агентство передовых исследований в сфере разведки (Intelligence Advanced Research Projects Activity, IARPA, аналог DARPA, работающий в интересах разведывательного сообщества США) разрабатывает программы анализа информации в СМИ с целью прогнозирования событий для предотвращения социальной нестабильности, международных конфликтов и террористических атак.

IARPA реализует восемь программ обработки текстовой и фото- и видеоинформации. Три из них завершены в 2010-2015 гг.

Программы имеют срок реализации от года до пяти лет. В некоторых случаях по результатам завершённых программ начинаются новые. К исследованиям допускаются зарубежные научные коллективы.

Данные о внедрении конкретных результатов программ в государственные и/или коммерческие структуры не публикуются.

Объёмы финансирования IARPA в целом и отдельных программ засекречены.

Программы IARPA

BETTER (Better Extraction From Text Towards Enhanced Retrieval) направлена на извлечение и структуризацию сложной семантической информации из большого массива текстов на различных языках. Цель: вычленить из текста смысл человеческих суждений, выявить социальную оценку событий, описанных в СМИ, и их влияние на аудиторию.

Источниками текстовой информации могут быть средства массовой информации, социальные сети, веб-сайты.

MATERIAL (Machine Translation For English Retrieval In Any Language) осуществляет обработку текстов на естественном языке, многоязычных онтологий, машинный перевод, кросс-языковой поиск и реферирование текстов, распознавание описываемой в тексте предметной области, многоязычное распознавания речи.

Задача программы заключается в разработке методов поиска речевого и текстового контента на языках с ограниченными ресурсами (редкие языки, например, африканских племен). Инструментарий программы учитывает фонетику, морфологию, порядок слов и социолингвистические особенности, включая стандартизацию письменности, грамотность и диалектологию. Ответ на запрос охватывает различные источники и предоставляет краткое резюме на английском языке.

Программа обучается на минимальном наборе обучающих данных и быстро «осваивает» новые языки.

JANUS (не аббревиатура) предлагает инструменты автоматической обработки видеоданных, звука, речи и изображения, например, распознавание лиц за счёт объединения пространственной, временной и контекстной информации, доступной из множества изображений.

Программа может обнаруживать человека по одному из признаков, если признак имеет метку в наборе данных. Например, при наличии видео без человека в кадре, но с голосовым сопровождением, Janus опознает человека по голосу.

Результатом разработок должны стать репрезентативные модели ИИ, которые будут кодировать форму, текстуру и динамику лица, распознавать голос при наличии постороннего шума. Программа завершена.

CLIR (Cross-Language Information Retrieval) позволяет извлекать релевантный контент на одном или нескольких языках, отличных от языка запроса, и предлагает ПО для автоматической обработки этих языков. В 2020 году программа включала шесть языков (тагальский, суахили, сомалийский, болгарский, литовский, пуштунский), которые представляют типологическое разнообразие и доступны в сети Интернет.

ODIN (это не аббревиатура) предлагает методы обнаружения фальсификаций биометрические параметры: лицо, отпечаток пальца, радужная оболочка глаза. Программа будет способна отличать, например кожу от силикона, стекло от человеческого глаза. Программа сможет различать цвет кожи, определяя расу человека (как это соотносится с современной американской BLM-толерантностью, непонятно – ред.).

OSI (Open Source Indicators) направлена на разработку методов непрерывного и автоматизированного анализа доступных данных с целью распознавания и/или заблаговременного прогнозирования политических кризисов, очагов эпидемий, экономической нестабильности, дефицита ресурсов и природных бедствий. Программа будет обрабатывать текстовые сообщения на четырёх языках: английском, русском, фарси и испанском.

EMBERS (Early Model Based Event Recognition using Surrogates) ‒ система прогнозирования значимых социальных явлений. Использует открытые источники, такие как (новости СМИ, блоги, твиты, цены на продовольствие, курсы валют и др.) в режиме 24/7. Прогнозы осуществляются по трём регионам: Латинская Америка, Северная Африка и Ближний Восток. Ежемесячно прогнозы сравниваются с отчётами корпорации MITRE для выявления несоответствий между машинным прогнозом и прогнозом, сделанным человеком. В работе системы апробировались реальные события, для которых EMBERS нашла индикаторы в контенте социальных сетей и составила правильные прогнозы. Программа завершена.

Aladdin Video (Automated Low-Level Analysis And Description Of Diverse Intelligence Video) объединяет различные методы обработки и анализа видео. Цель программы заключается в автоматическом мониторинге больших массивов визуальной информации, создании алгоритмов скоростной видеообработки и технологий поиска видео по образцу или аналогии. В программе объединяются различные подходы по классификации видео на основе нейронных сетей и анализа видео по субтитрам. Программа завершена.

По материалам НТЦ ФГУП «ГРЧЦ»

Следите за нашим Телеграм-каналом, чтобы не пропускать самое важное!

Поделиться: