Как сборщики OSINT (разведданных из открытых источников) могут использовать технологии ИИ и машинного обучения для сбора информации, выявления ботов, обнаружения фейков и раскрытия скрытых связей для эффективной разведки в открытых источниках.
В январе 2024 года число активных пользователей социальных сетей в мире достигло 5,04 миллиарда. Для бизнеса и аналитиков эти платформы стали бесценным источником данных о клиентах, трендах и общественных настроениях. Однако огромный объем информации требует новых подходов к анализу. Огромный объем данных, доступных на платформах социальных сетей, стал ценным ресурсом для сборщиков OSINT. Фактически, сбор информации с открытым исходным кодом специально из социальных сетей породил свою собственную аббревиатуру: SOCMINT (Social Media Intelligence).
Алгоритмы NLP позволяют автоматизировать массовый сбор и осмысление текстового контента из постов, комментариев и твитов. Они способны:
2. Борьба с дезинформацией: обнаружение ботов
Координационные кампании и распространение фейков часто ведутся с помощью ботов. ML-модели обучаются на нормальном поведении пользователей и фиксируют аномалии:
3. Анализ изображений и видео
С появлением генеративного ИИ проблема deepfake стала как никогда острой. Алгоритмы машинного обучения помогают отличить созданный ИИ контент от реального путем:
Для ручного обнаружения нескольких объектов, таких как изображения, можно использовать любой из следующих инструментов: AI or Not (https://www.aiornot.com/ ), Сontent at Scale (https://contentatscale.ai/ai-image-detector/), Al Image Detector (https://huggingface.co/spaces/umm-maybe/AI-image-detector), SynthID от Google (https://deepmind.google/technologies/synthid/).
Однако, сборщики OSINT могут использовать другие методы для поиска изображений, созданных ИИ, такие как обратный поиск изображений и проверка метаданных изображений/видео.
4. Анализ сетей и связей
ИИ способен картографировать сложные сети взаимодействий между пользователями, выявляя:
https://authentic8.com/blog/ai-ml-for-socmint
В январе 2024 года число активных пользователей социальных сетей в мире достигло 5,04 миллиарда. Для бизнеса и аналитиков эти платформы стали бесценным источником данных о клиентах, трендах и общественных настроениях. Однако огромный объем информации требует новых подходов к анализу. Огромный объем данных, доступных на платформах социальных сетей, стал ценным ресурсом для сборщиков OSINT. Фактически, сбор информации с открытым исходным кодом специально из социальных сетей породил свою собственную аббревиатуру: SOCMINT (Social Media Intelligence).
Ключевые методы применения инструментов на основе ИИ в анализе социальных сетей
1. Обработка естественного языка (NLP)Алгоритмы NLP позволяют автоматизировать массовый сбор и осмысление текстового контента из постов, комментариев и твитов. Они способны:
- Анализировать тональность высказываний, определяя эмоции пользователей (гнев, радость, доверие).
- Выявлять и извлекать сущности: упоминания брендов, персон, локаций и событий в огромных массивах неструктурированного текста.
- Автоматически делать саммари из объемных текстов, выделяя основную суть.
- Фильтровать контент по языкам и ключевым словам, что значительно сужает область исследования для аналитиков.
2. Борьба с дезинформацией: обнаружение ботов
Координационные кампании и распространение фейков часто ведутся с помощью ботов. ML-модели обучаются на нормальном поведении пользователей и фиксируют аномалии:
- Неестественная частота публикаций.
- Подозрительные паттерны взаимодействий с другими пользователями/страницами на всей платформе.
- Активные часы.
- Чрезмерное использование хэштегов.
3. Анализ изображений и видео
С появлением генеративного ИИ проблема deepfake стала как никогда острой. Алгоритмы машинного обучения помогают отличить созданный ИИ контент от реального путем:
- Обнаружения шаблонов (изображения и видео, созданные с помощью искусственного интеллекта, могут иметь уникальные шаблоны (например, непоследовательные области текстуры, шаблоны шума, артефакты сжатия), которые могут обнаруживать обученные модели машинного обучения).
- Отпечаток пальца инструмента ИИ (Инструменты искусственного интеллекта оставляют уникальный отпечаток пальца при создании изображений и видео. Примеры таких отпечатков пальцев включают:
- Тонкие узоры, похожие на шахматную доску, которые особенно появляются в гладких градиентах или текстурах изображений, созданных ИИ
- Чрезмерное размытие или размытость, в основном при использовании сложных текстурных фонов
- Повторяющиеся шаблоны — некоторые инструменты искусственного интеллекта могут реплицировать определенный объект в сгенерированном изображении более одного раза).
Для ручного обнаружения нескольких объектов, таких как изображения, можно использовать любой из следующих инструментов: AI or Not (https://www.aiornot.com/ ), Сontent at Scale (https://contentatscale.ai/ai-image-detector/), Al Image Detector (https://huggingface.co/spaces/umm-maybe/AI-image-detector), SynthID от Google (https://deepmind.google/technologies/synthid/).
Однако, сборщики OSINT могут использовать другие методы для поиска изображений, созданных ИИ, такие как обратный поиск изображений и проверка метаданных изображений/видео.
4. Анализ сетей и связей
ИИ способен картографировать сложные сети взаимодействий между пользователями, выявляя:
- Скрытые сообщества и лидеров мнений.
- Потенциальные связи между аккаунтами (семейные, рабочие, дружеские).
- Группы по интересам на основе анализа активности и вовлеченности в темы.
https://authentic8.com/blog/ai-ml-for-socmint
