13.03.25

Сбер представил GigaChat 2.0 — новое поколение нейросети

Николай Абатуров

два ядра два гига

Страница автора

13 марта Сбер представил новую версию нейросети GigaChat.

В компании называют GigaChat 2.0 сильнейшей нейросетью на русском языке. Пока она доступна только бизнес-клиентам. Расскажу, что изменилось.

Все модели GigaChat получили апгрейд производительности. Как заявляют в Сбере, модели нового поколения обрабатывают в четыре раза больше контекста: максимальный объем запроса вырос с 48 до 200 страниц А4. Всего новых моделей три:

GigaChat 2.0 MAX — самая мощная в линейке.
GigaChat 2.0 Pro — для задач, в которых важны креатив и точность.
GigaChat 2.0 Lite — для решения простых задач.

Бесплатный курс Учебника Т⁠—⁠Ж «Как упростить жизнь с помощью нейросетей»

GigaChat 2.0 в два раза лучше решает рабочие задачи. Модели точнее следуют инструкциям и на 25% лучше отвечают на вопросы, соблюдают условия и отвечают в заданном формате. Производительность GigaChat 2.0 Pro теперь на уровне MAX предыдущего поколения, а GigaChat 2.0 Lite — на уровне прошлой Pro-версии.

Сравнение GigaChat 2.0 MAX с другими ИИ-моделями в ряде бенчмарков

Категория	Название бенчмарка	GigaChat 2 MAX	Qwen 2.5 72B	Llama 3.3 70B	GPT-4o	DeepSeek-V3
Общие знания	MMLU (RU)	80,46	78,30	65,08	80,00	73,74
	MMLU (EN)	86,00	83,85	78,57	88,70	85,24
Математика	GSM8K	95,68	95,07	92,87	95,00	94,99
	MATH	77,26	78,74	62,80	76,60	85,48
Работа с кодом	HumanEval	87,20	86,60	86,00	84,00	91,46
Следование инструкциям	IFEVAL (RU)	83,62	84,27	75,12	80,24	84,37
Следование инструкциям	IFEVAL (EN)	89,99	90,43	90,83	88,51	92,21

Сравнение GigaChat 2.0 MAX с другими ИИ-моделями в ряде бенчмарков

Общие знания. MMLU (RU)
GigaChat 2 MAX	80,46
Qwen 2.5 72B	78,30
Llama 3.3 70B	65,08
GPT-4o	80,00
DeepSeek-V3	73,74
Общие знания. MMLU (EN)
GigaChat 2 MAX	86,00
Qwen 2.5 72B	83,85
Llama 3.3 70B	78,57
GPT-4o	88,70
DeepSeek-V3	85,24
Математика. GSM8K
GigaChat 2 MAX	95,68
Qwen 2.5 72B	95,07
Llama 3.3 70B	92,87
GPT-4o	95,00
DeepSeek-V3	94,99
Математика. MATH
GigaChat 2 MAX	77,26
Qwen 2.5 72B	78,74
Llama 3.3 70B	62,80
GPT-4o	76,60
DeepSeek-V3	85,48
Работа с кодом. HumanEval
GigaChat 2 MAX	87,20
Qwen 2.5 72B	86,60
Llama 3.3 70B	86,00
GPT-4o	84,00
DeepSeek-V3	91,46
Следование инструкциям. IFEVAL (RU)
GigaChat 2 MAX	83,62
Qwen 2.5 72B	84,27
Llama 3.3 70B	75,12
GPT-4o	80,24
DeepSeek-V3	84,37
Следование инструкциям. IFEVAL (EN)
GigaChat 2 MAX	89,99
Qwen 2.5 72B	90,43
Llama 3.3 70B	90,83
GPT-4o	88,51
DeepSeek-V3	92,21

На русском языке GigaChat 2.0 MAX опережает GPT-4o и DeepSeek-V3. Среди ИИ-моделей новая MAX-версия занимает первое место в бенчмарке MERA для оценки больших языковых моделей для русского языка, а GigaChat 2.0 Pro — второе. При работе на английском языке нейросеть «не уступает мировым лидерам», утверждают в Сбере.

На базе GigaChat 2.0 можно создавать ИИ-агентов, которые способны рассуждать и решать сложные задачи без участия человека. Для этого моделям расширили знания в математике, естественных и гуманитарных науках, программировании.

Линейка GigaChat 2.0 пока доступна только для бизнеса. Ее можно протестировать в облаке через API или развернуть в локальной инфраструктуре компании. Когда модели станут доступны обычным пользователям, неизвестно.

Мы постим кружочки, красивые карточки и новости о технологиях и поп-культуре в нашем телеграм-канале. Подписывайтесь, там классно: @t_technocult

сервисы интернет технологии новости технологий нейросети

Николай АбатуровЧем пользуетесь чаще, GigaChat или ChatGPT?

СергейНу, пока она обычным гражданам не доступна, то и сильнейшей называть не стоит думаю.16
marymaryВсе новости уже про эти нейросети..4
Александр АлександровСергей, а как станет доступна, так сильнейшей называть будет неудобно18
Сергей СоколенкоПриходится пользоваться этим поделием, поскольку встроено в мобильное приложение Сбера. Полная шляпа, ищет рандомное и что-то, видимо, своё, а не по моему запросу.1
Иваника ИвановаЯ не удержалась 🤭2
Илья СмирновТут комментарии излишни, по сравнению с предыдущими версиями уже все понятно становится.0
ФруФруА кто может объяснить как это работает? Допустим я хочу встроить на свой сайт чат бот с ИИ, который будет отвечать на вопросы по теме моего сайта, какая принципиальная схема тут? сайт + API + Gigachat ? А на стороне гигачата я прописываю ограничения и логику? Или в самом API определяю логику и ограничении я по ответам? Чтобы не вышло так, что я прикрутил Gigachat и все пользователи начали сливать мой бюджет на запросы к Gigachat по своим личным потребностям. Мне эта тема до сих пор не оч ясна. =((1
Код "Леопольд"0
SlavdmiПервый гигачат был очень плох в гуманитарных запросах (типа пересказать текст или просто найти информацию)0
fed0soffmarymary, нужно быть в курсе, они ж полезны1
Артем ВагинЕсли работать через сайт, то, по сравнению с предыдущими версиями значительно хуже производительность: 1. нейросеть после ответа на простой запрос предлагает сама три уточняющих вопроса о тексте, после клика выдает 100+ пунктов, не имеющих или слабо связанных с топиком и идёт в отказ 2. всё еще не умеет на базовом уровне писать математические формулы 3. так и не научилась работать с таблицами. 2.0 только на словах. Не спорю, вполне возможно рассуждения стали глубже и прочее, но пользовательский опыт даже в сравнении с обхаянной Deepseek весьма разочаровывающий. П.С в старых сценариях никаких изменений нет.0
АлександрЛучше бы какой то конкретный инструмент придумали или приложение с ии под капотом. К примеру, хочу тренировать произношение на английском. Мне не нужен чат где я буду ломать голову какой же промт мне выкинуть. Я хочу готовую программу которую можно скачать из Гугл плей.0
Синий цветGigaChat ни разу не приходилось пользоваться, а вот ChatGPT пока любимчик из всех ИИ , учитывая , что есть возможность им пользоваться бесплатно.0
marymaryfed0soff, Я не пользуюсь ими0
Алексей КлимовскийQwen какой брали, MAX?1
Ашот ОганесянDeepseek бесплатен для масс, как они хотят конкурировать с такими нейросетями?)0
Витек ИиПомойка от сбер, где глава хочет править человеками.0
Oleg R.Сергей, какая связь?1
Алексей КозловGigaChat отстой с коротким контекстом. Там 8192 токена, что сравнимо с локальной моделью. Поэтому большой запрос этот отстой обработать не в состоянии. Поэтому не надо сравнивать инструменты, которые в принципе не подлежат сравнению. Глупо сравнивать калькулятор с чат гпт, дипсиком, и даже некоторыми частными нейросетями, которые на удивление хорошо держат контекст. А гигачат напоминает дешевую китайскую флэшку на два терабайта, когда память кончается она затирает токены, и не сообщает. Вы думаете, что контекст существует и исходя из этого ведёте диалог, а контекста давно уже нет и оказывается вы зря теряете время.0
Виталий Иванович ИвановУ меня самый любимый Grok. Для некоторых задач предпочтительнее DeepSeek и Copilot. Алиса желает много-много лучшего, но не совсем никчёмная. Le Chat совсем негодный, ни одного сценария у меня для него не нашлось. ChatGPT ни рыба, ни мясо, ни хорош, ни плох. 🤷‍♂️🙂 Всё это у меня стоит и регулярно юзается либо спорадически тестируется. --1
Виталий Иванович Ивановmarymary, из-за чего Вы не юзаете электропсевдоинтеллекты? Что Вам мешает? 🤔0
Виталий Иванович ИвановАртем, за что именно 'хаяли' DeepSeek? На мои глаза не попадало. 🤷‍♂️🙂0
Александр ЧураковПусть ещё умные колонки от Сбера доработают, а то Г... полное0
Илья СмирновЭта версия как все говорят намного мощнее предыдущей, посмотрим как оно на самом деле.0
Мама Папаmarymary, а я не пользуюсь самолётами - но их упоминание в новостях меня не цепляет. Это просто ещё одна крайне популярная тема - даже вопреки тому, что вы не пользуетесь0
Мама ПапаФруФру, поздновато уже - но апи обычно чисто запрос-ответ. В запросе и история сообщений (для понимания контекста), и последнее сообщение от пользователя, и ваш собственный системный промпт с задачей и пояснением, как отвечать и что вообще можно/нельзя, и настройки. Апи вызывается с сервера (на клиент же ключ не передашь), сервер же и управляет логикой1
marymaryВиталий, Нет надобности просто0