8200 создало обучающую языковую модель из перехватов палестинских сообщений
Израильское разведывательное подразделение 8200 создало огромную базу данных перехваченных палестинских сообщений для разработки инструмента искусственного интеллекта, аналогичного ChatGPT, сообщают газета The Guardian, онлайн-газета +972 Magazine и портал Mekomit.
"Этот ИИ должен трансформировать разведывательные возможности Израиля", - утверждают журналисты.
По данным расследования, подразделение 8200 обучила большую языковую модель (LLM) распознавать устную арабскую речь, особенно палестинский и ливанский диалекты, путем анализа большого объема перехваченных телефонных разговоров и текстовых сообщений.
Цель - создать продвинутого чат-бота, способного анализировать и давать рекомендации по действиям против наблюдаемых лиц. "Я могу отслеживать активистов за права человека, контролировать строительство в зоне C и знать, чем занимается каждый человек", — рассказал один из израильских источников.
На конференции по ИИ в Тель-Авиве бывший офицер разведки Роджер Джозеф Сайдофф подтвердил участие в разработке модели. "Мы собирали всю информацию на арабском, которую когда-либо получал Израиль", — заявил он.
По данным The Guardian, офицеры 8200 были набраны из ведущих американских технокомпаний, включая Google, Meta и Microsoft, за их опыт в создании LLM.
Однако обучение модели столкнулось с проблемой: большинство арабоязычных ИИ обучены на литературном арабском, а не разговорных диалектах. "В интернете нет стенограмм звонков или чатов в WhatsApp в нужном объеме", — пояснил источник.
Чтобы восполнить пробел, 8200 централизовала весь перехваченный устный арабский текст. Сайдофф признал, что их работа концентрировалась только на тех диалектах, которые нас ненавидят.
Модель также обучили военной терминологии, используемой вооруженными группировками. В ее обучающих данных содержится около 100 миллиардов слов.
Пока неясно, развернул ли Израиль эту модель ИИ, но его обучение продолжалось во второй половине 2024 года.
Пресс-служба ЦАХАЛ отказалась комментировать разработку LLM, заявив лишь, что военные используют различные разведывательные методы для выявления и предотвращения террористической деятельности.