Вкратце
- Google выпустил Gemma 4 — семейство открытых моделей под лицензией Apache 2.0.
- Линейка из четырех моделей охватывает устройства от телефонов до дата-центров, при этом модель 31B уже занимает 3-е место в мире.
- Американский open-source ИИ получает необходимый импульс, поскольку Gemma 4 — при поддержке DeepMind — позиционирует себя как сильнейший американский конкурент DeepSeek, Qwen и других китайских лидеров.
Сегодня амбиции Google в области открытого ИИ стали гораздо серьезнее. Компания выпустила Gemma 4 — семейство из четырех моделей с открытыми весами, построенных на тех же исследованиях, что и Gemini 3, и лицензированных под Apache 2.0 — значительный отход от более ограничительных условий предыдущих версий Gemma.
Разработчики скачали предыдущие поколения Gemma более 400 миллионов раз, создав более 100 000 вариантов сообщества. Этот релиз — самый амбициозный на данный момент.
За последний год таблица лидеров open-source ИИ была в основном китайским делом. DeepSeek, Minimax, GLM и Qwen доминировали в верхних позициях, оставляя американские альтернативы бороться за актуальность. Как сообщал Decrypt в прошлом году, китайские открытые модели выросли с едва 1,2% мирового использования открытых моделей в конце 2024 года до примерно 30% к концу 2025 года, при этом Qwen от Alibaba даже обогнал Llama от Meta как наиболее используемую самостоятельно размещаемую модель в мире.
Llama от Meta раньше был выбором по умолчанию для разработчиков, которые хотели производительную локально запускаемую модель. Эта репутация пошатнулась — контролируемая Meta лицензия Llama вызвала вопросы о его истинном статусе open-source, а его производительность отстала от китайской конкуренции. Семейство OLMo от Allen Institute пыталось заполнить пробел, но не смогло получить значимого признания. OpenAI выпустил свои модели gpt-oss в августе 2025 года, что дало экосистеме глоток свежего воздуха, но они никогда не предназначались для того, чтобы быть передовыми конкурентами.
А вчера американский стартап из 30 человек под названием Arcee AI выпустил Trinity — открытую модель с 400 миллиардами параметров, которая убедительно доказала, что американская сцена не совсем мертва. Gemma 4 следует этому импульсу, на этот раз с полной поддержкой Google DeepMind, превращая его, возможно, в лучшую американскую модель на open-source ИИ сцене.
Модель «построена на основе тех же мирового класса исследований и технологий, что и Gemini 3», — заявил Google в своем объявлении. Gemma 4 поставляется в четырех размерах: эффективные 2B и 4B для телефонов и периферийных устройств, модель Mixture of Experts 26B, ориентированная на скорость, и модель Dense 31B, оптимизированная для чистого качества.
31B Dense в настоящее время занимает третье место среди всех открытых моделей в текстовой таблице лидеров Arena AI. 26B MoE находится на шестом месте. Google утверждает, что обе превосходят модели в 20 раз больше их размера — утверждение, которое подтверждается, по крайней мере, по данным Arena AI, где китайские модели по-прежнему занимают первые два места.
Мы протестировали Gemma 4. Она способна, но с некоторыми оговорками. Модель применяет рассуждения даже к задачам, которые этого не требуют, что может сделать ответы чрезмерно сложными для простых запросов. Творческое письмо приличное — функциональное, но не вдохновляющее — и, вероятно, улучшается с более конкретным руководством и prompt engineering.
Где она проявила себя наиболее ярко — это код. На запрос создать игру результат не был особенно эффектным или детализированным, но он запустился без ошибок с первой попытки. Неплохо для модели с 41 миллиардом параметров. Эта надежность zero-shot, возможно, более ценна, чем более красивый результат, требующий отладки.
Вы можете попробовать (базовую, но функциональную) игру здесь.
Четыре варианта охватывают весь спектр оборудования. Модели E2B и E4B созданы для телефонов Android, Raspberry Pi и периферийных устройств, работающих полностью офлайн с практически нулевой задержкой, нативным аудиовходом и контекстным окном 128K. Модели 26B и 31B нацелены на рабочие станции и облачные развертывания, расширяя контекст до 256K и добавляя нативный вызов функций и структурированный вывод JSON для построения автономных агентов. Все четыре модели обрабатывают изображения и видео нативно. Полноточные веса больших моделей помещаются на один GPU NVIDIA H100 80GB; квантованные версии работают на потребительском оборудовании.
Лицензия Apache 2.0 — другая главная новость. Предыдущие релизы Gemma от Google использовали пользовательскую лицензию, которая создавала юридическую неопределенность для коммерческих продуктов. Apache 2.0 полностью устраняет это трение — разработчики могут модифицировать, распространять и коммерциализировать, не беспокоясь о том, что Google изменит условия позже. Сооснователь Hugging Face Клемент Деланг похвалил это, заявив, что «Локальный ИИ переживает свой момент», и это будущее индустрии ИИ. Генеральный директор Google DeepMind Демис Хассабис пошел дальше, назвав Gemma 4 «лучшими открытыми моделями в мире для своих соответствующих размеров».
Это сильное заявление. Проприетарные системы от Anthropic, OpenAI и собственный Gemini от Google по-прежнему лидируют в самых сложных бенчмарках. Но для моделей с открытыми весами, которые вы можете запускать локально, свободно модифицировать и развертывать на собственной инфраструктуре? Конкуренция только что стала значительно меньше. Вы можете попробовать Gemma 4 прямо сейчас в Google AI Studio (31B и 26B) или Google AI Edge Gallery (E2B и E4B). Веса моделей также доступны на Hugging Face, Kaggle и Ollama.
Ежедневная рассылка новостей
Начинайте каждый день с главных новостей прямо сейчас, а также оригинальных материалов, подкастов, видео и многого другого.
Источник: https://decrypt.co/363178/google-gemma-4-open-source-ai








