Meta представила Llama 4 — ответ ChatGPT и Google Gemini
Компания Meta представила новое поколение языковых моделей искусственного интеллекта — серию Llama 4. В неe вошли три основные модели: Scout, Maverick и Behemoth. Эти разработки нацелены на прямую конкуренцию с аналогами от OpenAI и Google — ChatGPT и Gemini соответственно.
Модель Llama 4 Scout предназначена для работы с ограниченными вычислительными ресурсами — она способна функционировать на одном графическом процессоре Nvidia H100. Scout имеет уникально большое окно контекста — до 10 миллионов токенов, что делает ее подходящей для задач вроде суммирования документов или анализа программного кода. По информации Meta, Scout превосходит модели Gemma 3 от Google и Mistral 3.1 по производительности в ряде задач.
Модель Llama 4 Maverick требует более мощного оборудования и ориентирована на выполнение задач, связанных с генерацией текстов, взаимодействием с пользователями и выполнением роли цифрового ассистента. По данным Meta, Maverick успешно конкурирует с моделями GPT-4o и DeepSeek-V3, особенно в задачах логического вывода и программирования, при этом отличается более эффективной структурой за счет использования меньшего числа активных параметров.
Модель Llama 4 Behemoth, находящаяся пока на этапе разработки, станет самой масштабной в линейке, с числом параметров, приближающимся к двум триллионам. Она будет нацелена на решение сложных задач в областях математики и естественных наук. Meta утверждает, что Behemoth уже показывает результаты, сопоставимые с самыми продвинутыми моделями конкурентов, включая GPT-4.5 и Claude Sonnet 3.7.
Все три модели построены на архитектуре типа Mixture of Experts (MoE), что означает активацию лишь части нейронной сети при каждом запросе. Такой подход позволяет значительно снизить нагрузку на систему и повысить эффективность работы моделей.
Кроме того, Meta подчеркивает, что новые модели Llama 4 лучше справляются с социально чувствительными и политически спорными темами. Это направление было приоритетным в разработке, на фоне глобальной критики в адрес ИИ-систем за возможную политическую ангажированность.