
OpenAI выпустила модели o3 и o4-mini для ChatGPT — они умеют «думать картинками»

16 апреля 2025 года OpenAI представила две новые модели: o3 и o4-mini.
Обе нейросети — «рассуждающие». То есть они размышляют, прежде чем дать ответ, и строят цепочку рассуждений, которую можно посмотреть. В отличие от предыдущих моделей, o3 и o4-mini научились интегрировать изображения в процесс мышления и пользоваться другими инструментами ChatGPT.
Главные различия моделей: o3 — более мощная, но доступна по платной подписке, а o4-mini — не такая умная, зато быстрая и есть в бесплатной версии. Расскажу подробнее.
«Рассуждающие» модели научились использовать все инструменты ChatGPT. Теперь они могут искать информацию в интернете, анализировать загруженные файлы и данные с помощью Python, интерпретировать изображения, генерировать картинки, комбинировать несколько функций, если это необходимо.
Модели сами понимают, когда использовать инструменты и какие выбрать, — им не нужно напрямую указывать это в запросе.
Модели получили визуальное мышление. Они научились встраивать изображения прямо в цепочку рассуждений. Нейросети не просто «видят» картинку — они как бы «думают» с ее помощью.
Если пользователь загрузит фото с доски, схему из учебника или нарисованный от руки эскиз, модель распознает изображение — даже размытое, отзеркаленное или плохого качества. А с помощью встроенных инструментов она может в процессе рассуждения поворачивать, приближать и преобразовывать картинки.

Модели могут выполнять многоступенчатые задачи. Они не просто дают ответы, а продумывают решение задачи, выбирая, когда и какой инструмент использовать и в каком формате выдать результат. Например, если спросить, как изменится потребление энергии в Калифорнии этим летом по сравнению с прошлым, модель может:
- найти актуальные данные на сайтах коммунальных служб;
- написать код на Python для прогноза;
- построить график;
- объяснить, как получился такой результат, используя несколько инструментов.
o3 — самая мощная «рассуждающая» модель OpenAI. Согласно результатам внутренних тестов, она допускает на 20% меньше ошибок, чем o1, особенно в практических задачах: программировании, генерации креативных идей, бизнес-анализе. Она также эффективна при сложных запросах, где нужно учитывать сразу несколько факторов, а ответ не лежит на поверхности.
o4-mini — компактная «рассуждающая» модель, оптимизированная для быстрых ответов. Она хорошо справляется с математикой, программированием и работой с визуальными данными.
o3, o4-mini и o4-mini-high уже доступны по подпискам Plus, Pro и Team. В ChatGPT они заменят o1, o3-mini и o3-mini-high. Доступ для пользователей Enterprise и Edu откроется на неделе с 21 по 27 апреля 2025 года. Для подписчиков Pro за 200 $ (16 403 ₽) «в ближайшие недели» планируют выпустить модель o3-pro.
o4-mini также могут воспользоваться бесплатные пользователи. Для этого нужно включить режим «Обоснуй» перед отправкой запроса.
o3 и o4-mini доступны для разработчиков через API. o3 стоит 10 $ (821 ₽) за миллион входящих токенов и 40 $ (3286 ₽) за миллион исходящих. o4-mini в 10 раз дешевле: 1,1 $ (90 ₽) за миллион входящих и 4,4 $ (361 ₽) за миллион исходящих.

Мы постим кружочки, красивые карточки и новости о технологиях и поп-культуре в нашем телеграм-канале. Подписывайтесь, там классно: @t_technocult