Новости
664

OpenAI выпустила модели o3 и o4⁠-⁠mini для ChatGPT — они умеют «думать картинками»

2
OpenAI выпустила модели o3 и o4⁠-⁠mini для ChatGPT — они умеют «думать картинками»
Аватар автора

Даша Лейзаренко

знает, чем различаются o4 и 4o

Страница автора

16 апреля 2025 года OpenAI представила две новые модели: o3 и o4-mini.

Обе нейросети — «рассуждающие». То есть они размышляют, прежде чем дать ответ, и строят цепочку рассуждений, которую можно посмотреть. В отличие от предыдущих моделей, o3 и o4-mini научились интегрировать изображения в процесс мышления и пользоваться другими инструментами ChatGPT.

Главные различия моделей: o3 — более мощная, но доступна по платной подписке, а o4-mini — не такая умная, зато быстрая и есть в бесплатной версии. Расскажу подробнее.

«Рассуждающие» модели научились использовать все инструменты ChatGPT. Теперь они могут искать информацию в интернете, анализировать загруженные файлы и данные с помощью Python, интерпретировать изображения, генерировать картинки, комбинировать несколько функций, если это необходимо.

Модели сами понимают, когда использовать инструменты и какие выбрать, — им не нужно напрямую указывать это в запросе.

Модели получили визуальное мышление. Они научились встраивать изображения прямо в цепочку рассуждений. Нейросети не просто «видят» картинку — они как бы «думают» с ее помощью.

Если пользователь загрузит фото с доски, схему из учебника или нарисованный от руки эскиз, модель распознает изображение — даже размытое, отзеркаленное или плохого качества. А с помощью встроенных инструментов она может в процессе рассуждения поворачивать, приближать и преобразовывать картинки.

«Рассуждающая» модель приблизила картинку, чтобы лучше «рассмотреть» корабли. Источник: openai.com
«Рассуждающая» модель приблизила картинку, чтобы лучше «рассмотреть» корабли. Источник: openai.com

Модели могут выполнять многоступенчатые задачи. Они не просто дают ответы, а продумывают решение задачи, выбирая, когда и какой инструмент использовать и в каком формате выдать результат. Например, если спросить, как изменится потребление энергии в Калифорнии этим летом по сравнению с прошлым, модель может:

  • найти актуальные данные на сайтах коммунальных служб;
  • написать код на Python для прогноза;
  • построить график;
  • объяснить, как получился такой результат, используя несколько инструментов.

o3 — самая мощная «рассуждающая» модель OpenAI. Согласно результатам внутренних тестов, она допускает на 20% меньше ошибок, чем o1, особенно в практических задачах: программировании, генерации креативных идей, бизнес-анализе. Она также эффективна при сложных запросах, где нужно учитывать сразу несколько факторов, а ответ не лежит на поверхности.

o4-mini — компактная «рассуждающая» модель, оптимизированная для быстрых ответов. Она хорошо справляется с математикой, программированием и работой с визуальными данными.

o3, o4-mini и o4-mini-high уже доступны по подпискам Plus, Pro и Team. В ChatGPT они заменят o1, o3-mini и o3-mini-high. Доступ для пользователей Enterprise и Edu откроется на неделе с 21 по 27 апреля 2025 года. Для подписчиков Pro за 200 $⁣ (16 403 ₽)  «в ближайшие недели» планируют выпустить модель o3-pro.

o4-mini также могут воспользоваться бесплатные пользователи. Для этого нужно включить режим «Обоснуй» перед отправкой запроса.

o3 и o4-mini доступны для разработчиков через API. o3 стоит 10 $⁣ (821 ₽) за миллион входящих токенов и 40 $⁣ (3286 ₽) за миллион исходящих. o4-mini в 10 раз дешевле: 1,1 $⁣ (90 ₽) за миллион входящих и 4,4 $⁣ (361 ₽) за миллион исходящих.

Чтобы включить режим рассуждений o4-mini, достаточно нажать кнопку «Обоснуй»
Чтобы включить режим рассуждений o4-mini, достаточно нажать кнопку «Обоснуй»

Мы постим кружочки, красивые карточки и новости о технологиях и поп-культуре в нашем телеграм-канале. Подписывайтесь, там классно: @t_technocult

Даша ЛейзаренкоС какими задачами вам помогают «рассуждающие» модели?
Вот что еще мы писали по этой теме