
Может ли ChatGPT сдать ЕГЭ по русскому и по математике? Мы проверили
Обычно нейросети проверяют на бенчмарках — специальных тестах для проверки знаний и оценки их работы.
Мы пошли другим путем: в преддверии ЕГЭ дали ChatGPT задания по русскому и математике. Если школьник не сдаст эти предметы, он не получит аттестат о среднем образовании.
Рассказываем, сколько баллов набрала нейросеть, с чем справилась, а с чем нет. Тестовую часть сверили сами, а задания с развернутым ответом показали экспертам, которые проверяют работы на настоящем ЕГЭ.
Как проходил эксперимент
Как выбирали задания. Экзамен составили на популярной платформе «Решу ЕГЭ». Там собраны задачи из открытого банка ФИПИ, демоверсий, прошедших ЕГЭ, авторских подборок от редакции сервиса. Получились варианты, приближенные к реальным: в генератор вариантов на «Решу ЕГЭ» попадают задания, подходящие под критерии текущего года. Также в них были ответы с решениями, которые потом пригодились для сверки.
ЕГЭ оценивают первичными и производными баллами, или тестовыми. Первичные баллы разные в каждом предмете, потом их переводят в тестовые по специальной таблице — в стобалльную шкалу.
Какая нейросеть решала ЕГЭ. Мы выбрали ChatGPT — самый популярный чат-бот в мире. Он недоступен в России, но уверенно отвечает на русском языке. Мы использовали модель GPT-4o — актуальную базовую версию. Она доступна бесплатно, но мы положились на платную версию, чтобы не было лимитов .
Мы проходили каждый экзамен в отдельном чате, чтобы исключить влияние одного предмета на другой. Вряд ли нейросеть перепутала бы русский язык с математикой, но ChatGPT запоминает контекст диалога, и в теории могла бы начать использовать логику или стиль из предыдущих заданий.
Какие условия были у нейросети. При решении ЕГЭ по русскому копировали задания и вставляли их в диалог текстом. А вот для математики использовали скриншоты: так проще избежать путаницы с формулами.
Мы использовали такой вводный запрос: «Я решаю ЕГЭ. Буду отправлять тебе задания по одному, а ты должен их решить. Вот первое: [условие задачи]». Дальше отправляли нейросети задания по одному.
Если в формулировке задания явно указывалось, что правильных ответов несколько, а нейросеть выдавала только один, мы писали, что «ответов должно быть два или больше». В остальных случаях мы не подсказывали и не редактировали решения — принимали ровно тот ответ, который выдала ChatGPT. От этого правила мы отошли только один раз, когда нейросеть запуталась в правиле на Н и НН.
Как нейросеть сдала ЕГЭ по русскому
ЕГЭ по русскому языку состоит из двух частей. В первой — тестовые задания, которые проверяют знание орфографии, лексики, грамматики, пунктуационных норм. Во второй части одно задание — сочинение на основе заданного текста, в нашем случае это был отрывок из сочинения Валентина Катаева. Его проверяют эксперты по специальным критериям.
На решение заданий ученикам дают 3 часа 30 минут. Нейросеть справилась со всем за полчаса. Вот что получилось.
В тестовой части ChatGPT правильно решила 20 заданий из 26. Ошибки оказались разбросаны по разным темам — нельзя сказать, что у модели есть слабое место в какой-то конкретной области русского языка.
Промахи случались в заданиях самых разных типов, но чаще — в тех, где нужно выбрать сразу несколько правильных вариантов. В одних случаях нейросеть добавляла лишний ответ, в других — упускала нужный.
Вероятно, такие ошибки связаны с тем, что модель не всегда верно распознает структуру задания и требования к ответу. Она выбирает наиболее вероятный вариант, игнорируя детали — например, что правильных должно быть несколько.

Бывает и такое, что нейросеть пишет слово правильно, но утверждает иное. Например, в одном задании ChatGPT верно использовала слово «песчаный» — с одной буквой Н, как и положено. Но в пояснении утверждала, что в слове две Н. В итоге ответ на задание получился неправильный. А позже — наоборот: настаивала, что «песчаный» входит в исключения и надо писать две Н.
Это типичный пример галлюцинации — когда нейросеть пишет бред и пытается убедить пользователя в истине своего утверждения. Это опасно, потому что нейросеть может ввести в заблуждение, если вы не перепроверяете ее ответы.




Еще одна ошибка: в задании на словообразование ChatGPT перепутала часть речи. Вместо наречия «звонче» выбрала глагол «положи». Видимо, с определением грамматических форм в русском языке у модели есть трудности.
В итоге 20 набранных первичных баллов принесли бы ChatGPT 43 тестовых.
Тестовая часть ЕГЭ по русскому языку
№ | Тема задания | Ответ нейросети | Верен ли ответ |
---|---|---|---|
1 | Орфоэпия | во-вторых | ✅ |
2 | Лексика | 1 2 5 | ✅ |
3 | Стилистика | 1 3 4 5 | ✅ |
4 | Ударения | 1 2 3 4 | ❌ |
5 | Лексические нормы | сопротивление | ✅ |
6 | Лексические нормы | правильное | ✅ |
7 | Морфология | положи | ❌ |
8 | Синтаксис | 3 4 8 9 2 | ❌ |
9 | Гласные и согласные в корне | 2 3 | ✅ |
10 | Приставки, ъ и ь | 2 4 | ✅ |
11 | Суффиксы | 1 5 | ✅ |
12 | Суффиксы | 5 | ❌ |
13 | Не и ни | 2 3 5 | ✅ |
14 | Орфография | 1 5 | ✅ |
15 | Орфография | 2 | ✅ |
16 | Пунктуация | 1 2 5 | ❌ |
17 | Пунктуация | 2 3 5 | ✅ |
18 | Пунктуация | 3 4 | ✅ |
19 | Пунктуация | 1 | ✅ |
20 | Пунктуация | 1 2 4 | ✅ |
21 | Пунктуация | 1 3 | ✅ |
22 | Связь предложений в тексте | 6 5 1 9 3 | ✅ |
23 | Связь предложений в тексте | 5 | ❌ |
24 | Стили речи и типы текста | 2 5 | ✅ |
25 | Стили речи и типы текста | чинами | ✅ |
26 | Логика текста | 33 41 | ❌ |
Тестовая часть ЕГЭ по русскому языку
Задание № 1 | |
Тема задания | Орфоэпия |
Ответ нейросети | во-вторых |
Верен ли ответ | ✅ |
Задание № 2 | |
Тема задания | Лексика |
Ответ нейросети | 1 2 5 |
Верен ли ответ | ✅ |
Задание № 3 | |
Тема задания | Стилистика |
Ответ нейросети | 1 3 4 5 |
Верен ли ответ | ✅ |
Задание № 4 | |
Тема задания | Ударения |
Ответ нейросети | 1 2 3 4 |
Верен ли ответ | ❌ |
Задание № 5 | |
Тема задания | Лексические нормы |
Ответ нейросети | сопротивление |
Верен ли ответ | ✅ |
Задание № 6 | |
Тема задания | Лексические нормы |
Ответ нейросети | правильное |
Верен ли ответ | ✅ |
Задание № 7 | |
Тема задания | Морфология |
Ответ нейросети | положи |
Верен ли ответ | ❌ |
Задание № 8 | |
Тема задания | Синтаксис |
Ответ нейросети | 3 4 8 9 2 |
Верен ли ответ | ❌ |
Задание № 9 | |
Тема задания | Гласные и согласные в корне |
Ответ нейросети | 2 3 |
Верен ли ответ | ✅ |
Задание № 10 | |
Тема задания | Приставки, ъ и ь |
Ответ нейросети | 2 4 |
Верен ли ответ | ✅ |
Задание № 11 | |
Тема задания | Суффиксы |
Ответ нейросети | 1 5 |
Верен ли ответ | ✅ |
Задание № 12 | |
Тема задания | Суффиксы |
Ответ нейросети | 5 |
Верен ли ответ | ❌ |
Задание № 13 | |
Тема задания | Не и ни |
Ответ нейросети | 2 3 5 |
Верен ли ответ | ✅ |
Задание № 14 | |
Тема задания | Орфография |
Ответ нейросети | 1 5 |
Верен ли ответ | ✅ |
Задание № 15 | |
Тема задания | Орфография |
Ответ нейросети | 2 |
Верен ли ответ | ✅ |
Задание № 16 | |
Тема задания | Пунктуация |
Ответ нейросети | 1 2 5 |
Верен ли ответ | ❌ |
Задание № 17 | |
Тема задания | Пунктуация |
Ответ нейросети | 2 3 5 |
Верен ли ответ | ✅ |
Задание № 18 | |
Тема задания | Пунктуация |
Ответ нейросети | 3 4 |
Верен ли ответ | ✅ |
Задание № 19 | |
Тема задания | Пунктуация |
Ответ нейросети | 1 |
Верен ли ответ | ✅ |
Задание № 20 | |
Тема задания | Пунктуация |
Ответ нейросети | 1 2 4 |
Верен ли ответ | ✅ |
Задание № 21 | |
Тема задания | Пунктуация |
Ответ нейросети | 1 3 |
Верен ли ответ | ✅ |
Задание № 22 | |
Тема задания | Связь предложений в тексте |
Ответ нейросети | 6 5 1 9 3 |
Верен ли ответ | ✅ |
Задание № 23 | |
Тема задания | Связь предложений в тексте |
Ответ нейросети | 5 |
Верен ли ответ | ❌ |
Задание № 24 | |
Тема задания | Стили речи и типы текста |
Ответ нейросети | 2 5 |
Верен ли ответ | ✅ |
Задание № 25 | |
Тема задания | Стили речи и типы текста |
Ответ нейросети | чинами |
Верен ли ответ | ✅ |
Задание № 26 | |
Тема задания | Логика текста |
Ответ нейросети | 33 41 |
Верен ли ответ | ❌ |
Сочинение. С сочинением ChatGPT справилась уверенно — получила 20 баллов из 22 возможных. Нейросеть умеет рассуждать, формулировать мысли и строить логичный текст по заданной теме.
В нашем случае задание звучало так — «Почему первое впечатление о человеке может быть ошибочным?». Нужно было проанализировать отрывок из текста Валентина Катаева, выделить авторскую позицию, выразить к ней свое отношение, подкрепив аргументом из опыта: жизненного, литературного.


Содержание получилось грамотным и по структуре, и по смыслу. Модель сформулировала проблему и прокомментировала ее. Язык сочинения — с хорошим словарным запасом и логичными связками между абзацами.
Минус балл она получила за то, что нечетко связала примеры с формулировкой проблемы, не пояснила ее. Еще балл сняли за аргумент — по сути, его не было. В целом сочинение получилось на уровне уверенного выпускника. Если бы нейросеть лучше проработала аргументацию, могла бы получить максимум.
ChatGPT набрала 20 первичных баллов за сочинение — в сумме с тестовой частью получилось 40. Если перевести их в тестовые по специальной таблице, получится 73 балла за весь экзамен. Это выше среднего — в 2024 году типичный результат составлял 64 балла .
- 73 балла
- набрала ChatGPT на ЕГЭ по русскому языку
Как нейросеть сдала профильное ЕГЭ по математике
Профильный ЕГЭ по математике состоит из двух частей. В первой — 12 заданий, на которые достаточно дать краткий ответ. Процесс решения тут не проверяют. Вторая часть состоит из семи заданий, на которые нужно дать развернутый и подробный ответ.
Ученикам на решение дают 3 часа 55 минут. Нейросеть справилась за полчаса — у нас уходило больше времени на то, чтобы делать скриншоты заданий и отправлять в диалог, чем у ChatGPT — решать. Вот как она справилась.
Тестовая часть ЕГЭ по математике далась ChatGPT легко. В задачах на геометрию нейросеть показала себя уверенно — правильно рассчитала углы в окружности, не запуталась в координатах прямоугольника и точно определила высоту пирамиды.
Первую ошибку ChatGPT допустила в задании на условную вероятность. Вместо того чтобы рассчитать ее по формуле, модель просто сравнила количество точек и пришла к неправильному выводу. Зато с классической вероятностью — задачей про бросание монеты — справилась без ошибок.


Задачи по алгебре и математическому анализу ChatGPT тоже решила почти идеально: ей хорошо даются уравнения и логарифмы. Она ошиблась только в задании на работу с графиком функции, где нужно было определить значение параметра по точке на графике. Модель неправильно определила знак, из-за чего дала неверный ответ.
В итоге в тестовой части ChatGPT решила 10 задач из 12 и набрала 58 первичных баллов.
Тестовая часть ЕГЭ по математике
№ | Тема задания | Ответ нейросети | Верен ли ответ |
---|---|---|---|
1 | Геометрия | 35 | ✅ |
2 | Векторы | 5 | ✅ |
3 | Геометрия | 4 | ✅ |
4 | Теория вероятности | 0,5 | ✅ |
5 | Теория вероятности | 0,5 | ❌ |
6 | Уравнения и неравенства | −9 | ✅ |
7 | Степени и логарифмы | 0 | ✅ |
8 | Функции | 3 | ✅ |
9 | Прикладная задача | 0,08 | ✅ |
10 | Текстовая задача | 44 | ✅ |
11 | Зависимости между величинами | −0,04 | ❌ |
12 | Значения функции | 4 | ✅ |
Тестовая часть ЕГЭ по математике
Задание № 1 | |
Тема задания | Геометрия |
Ответ нейросети | 35 |
Верен ли ответ | ✅ |
Задание № 2 | |
Тема задания | Векторы |
Ответ нейросети | 5 |
Верен ли ответ | ✅ |
Задание № 3 | |
Тема задания | Геометрия |
Ответ нейросети | 4 |
Верен ли ответ | ✅ |
Задание № 4 | |
Тема задания | Теория вероятности |
Ответ нейросети | 0,5 |
Верен ли ответ | ✅ |
Задание № 5 | |
Тема задания | Теория вероятности |
Ответ нейросети | 0,5 |
Верен ли ответ | ❌ |
Задание № 6 | |
Тема задания | Уравнения и неравенства |
Ответ нейросети | −9 |
Верен ли ответ | ✅ |
Задание № 7 | |
Тема задания | Степени и логарифмы |
Ответ нейросети | 0 |
Верен ли ответ | ✅ |
Задание № 8 | |
Тема задания | Функции |
Ответ нейросети | 3 |
Верен ли ответ | ✅ |
Задание № 9 | |
Тема задания | Прикладная задача |
Ответ нейросети | 0,08 |
Верен ли ответ | ✅ |
Задание № 10 | |
Тема задания | Текстовая задача |
Ответ нейросети | 44 |
Верен ли ответ | ✅ |
Задание № 11 | |
Тема задания | Зависимости между величинами |
Ответ нейросети | −0,04 |
Верен ли ответ | ❌ |
Задание № 12 | |
Тема задания | Значения функции |
Ответ нейросети | 4 |
Верен ли ответ | ✅ |
Задания с развернутым ответом — самые сложные. Здесь дают баллы не только за решение задачи, но и за ход выполнения. Ни одно задание из этой части обычно не решают больше половины выпускников. Максимум — 47% за 13-е задание на тригонометрические уравнения .
За решение тригонометрического уравнения ChatGPT, как и школьники, получил высший балл. Несмотря на небольшой недочет в оформлении, ответ оказался верным — эксперт зачел его полностью.
Без ошибок нейросеть справилась и с прикладными задачами — правильно составила математические модели по условиям и верно провела вычисления. Экономическую задачу она тоже решила верно. Такие типы задач оказались для нее самыми легкими: они требовали четкого алгоритма и перевода условия текстовой задачи в формулы.
Проблемы начались там, где нужно пространственное мышление. Сложнее всего нейросети далась геометрия. В 14-й задаче она неправильно посчитала расстояние от точки до плоскости. Это задание в 2024 году верно решили 4% учеников. В 17-м примере ошиблась в нахождении длины отрезка, подставив некорректную формулу. Здесь в среднем справлялись 9% выпускников. При этом в обоих случаях начала она верно, но ошиблась в расчетах.
Еще одна ошибка закралась в задачу на графики функций. Вместо того чтобы рассмотреть взаимное расположение графиков визуально, нейросеть попыталась решить все аналитически, но не справилась и дала неверный ответ. Преподаватель порекомендовал решить это задачу графическим способом, потому что в таком случае проще прийти к правильному ответу.
Задания с развернутым ответом ЕГЭ по математике
№ | Тема задания | Максимальное количество баллов | Сколько набрала нейросеть |
---|---|---|---|
13 | Тригонометрическое уравнение | 2 | 2 |
14 | Геометрическая задача | 3 | 1 |
15 | Прикладная задача | 2 | 2 |
16 | Прикладная задача | 2 | 2 |
17 | Геометрическая задача | 3 | 1 |
18 | Графики функций | 4 | 1 |
19 | Экономическая задача | 4 | 4 |
Задания с развернутым ответом ЕГЭ по математике
Задание № 13 | |
Тема задания | Тригонометрическое уравнение |
Максимальное количество баллов | 2 |
Сколько набрала нейросеть | 2 |
Задание № 14 | |
Тема задания | Геометрическая задача |
Максимальное количество баллов | 3 |
Сколько набрала нейросеть | 1 |
Задание № 15 | |
Тема задания | Прикладная задача |
Максимальное количество баллов | 2 |
Сколько набрала нейросеть | 2 |
Задание № 16 | |
Тема задания | Прикладная задача |
Максимальное количество баллов | 2 |
Сколько набрала нейросеть | 2 |
Задание № 17 | |
Тема задания | Геометрическая задача |
Максимальное количество баллов | 3 |
Сколько набрала нейросеть | 1 |
Задание № 18 | |
Тема задания | Графики функций |
Максимальное количество баллов | 4 |
Сколько набрала нейросеть | 1 |
Задание № 19 | |
Тема задания | Экономическая задача |
Максимальное количество баллов | 4 |
Сколько набрала нейросеть | 4 |
В итоге за письменную часть нейросеть набрала 13 из 20 возможных баллов. В сумме с баллами за первую часть получается 23. Переведем первичные баллы в тестовые и получим 92 балла — почти максимум. Здесь нейросеть попала в 18% выпускников 2024 года, которые набрали от 81 до 100 баллов .
- 92 балла
- набрала ChatGPT на ЕГЭ по профильной математике
Что в итоге
- ChatGPT неплохо справляется с типовыми задачами. И в алгебре, и в орфографии нейросеть показывает уверенный уровень — ее ответы часто правильные, структура текста логична, а рассуждения соответствуют критериям экзамена.
- Нейросеть делает ошибки, причем порой грубые, и не замечает этого. Проблемы возникают в заданиях с несколькими правильными ответами, в грамматике, геометрии. Также модель может перепутать формулировки или неправильно интерпретировать визуальные данные.
- Сочинения — сильная сторона ChatGPT. Модель пишет связные и грамотные тексты по структуре экзамена. При этом качество аргументов может хромать.
- С математикой нейросеть справилась лучше, чем с русским языком, но, возможно, на других вариантах этого бы не случилось.
Мы постим кружочки, красивые карточки и новости о технологиях и поп-культуре в нашем телеграм-канале. Подписывайтесь, там классно: @t_technocult