Стоит ли покупать подписку на Chat­GPT ради GPT-⁠4.5: тестируем модель и сравниваем с бес­платной версией
Нейросети
2K
Сгенерированное изображение — Таня Бронникова / Midjourney

Стоит ли покупать подписку на Chat­GPT ради GPT-⁠4.5: тестируем модель и сравниваем с бес­платной версией

Оправдала ли себя модель, которую ждали несколько месяцев
6
Аватар автора

Ярослав Ивус

столкнул нейросети

Страница автора

Последняя флагманская модель OpenAI — GPT-4.5.

По словам главы компании Сэма Альтмана, по качеству диалога она наиболее приближена к человеку. Хотя это не рассуждающая модель, GPT-4.5 лучше понимает поставленные задачи, допускает меньше неточностей и отличается высоким уровнем креативности.

Сравню, правда ли GPT-4.5 лучше предыдущей версии GPT-4o.

Чем GPT-4.5 отличается от GPT-4o

OpenAI называет GPT-4.5 своей самой большой и продвинутой моделью. Разработчики говорят, что она полезна для решения профессиональных и творческих задач, лучше понимает пользователя, меньше галлюцинирует.

Но это не рассуждающая модель: GPT-4.5 не берет время на генерацию ответа и не строит цепочку рассуждений, как o1 или o3-mini. Поэтому GPT-4.5 справедливо сравнивать с предыдущей версией — GPT-4o.

Сравнительная таблица GPT-4.5 и GPT-4o

ХарактеристикаGPT-4.5GPT-4o
Дата выхода27 февраля 2025 года13 мая 2024 года
ДоступностьПо платной подписке стоимостью от 20 $⁣ (1737 ₽)  Бесплатно с ограничениями по количеству запросов
ОсобенностиПовышенный эмоциональный интеллект, улучшенное понимание намерений пользователя, более естественный диалогФокус на мультимодальность: Обрабатывает любые комбинации текста, аудио и изображений
ГаллюцинацииМеньше, чем у GPT-4oБольше, чем у GPT-4.5

Сравнительная таблица GPT-4.5 и GPT-4o

Дата выхода
GPT-4.527 февраля 2025 года
GPT-4o13 мая 2024 года
Доступность
GPT-4.5По платной подписке стоимостью от 20 $⁣ (1737 ₽) 
GPT-4oБесплатно с ограничениями по количеству запросов
Особенности
GPT-4.5Повышенный эмоциональный интеллект, улучшенное понима­ние намерений пользователя, более естественный диалог
GPT-4oФокус на мультимодальность: Обрабатывает любые комбинации текста, аудио и изображений
Галлюцинации
GPT-4.5Меньше, чем у GPT-4o
GPT-4oБольше, чем у GPT-4.5

Как пользоваться GPT-4.5

GPT-4.5 доступна на официальном сайте ChatGPT на любом уровне платной подписки. О том, как получить доступ к сайту и оплатить подписку, мы уже подробно рассказывали.

После регистрации и оплаты подписки модель можно выбрать в выпадающем меню. По умолчанию система предлагает предыдущую версию, GPT-4o, поэтому в каждом новом чате придется менять модель вручную.

OpenAI не раскрывает лимиты на использование GPT-4.5, но пользователи пишут, что по самой дешевой подписке Plus доступно примерно 45—50 сообщений в неделю. Этот запас можно быстро израсходовать за день, так что будьте внимательны.

Пока модель доступна только в «просмотре исследования». Имеется в виду исследовательское превью, просто перевод плохой
Пока модель доступна только в «просмотре исследования». Имеется в виду исследовательское превью, просто перевод плохой

Тестируем GPT-4.5

Я проверил возможности флагманской GPT-4.5 и доступной бесплатно GPT-4o на нескольких сценариях. В конце я сделаю вывод, насколько существенны различия и стоит ли оплачивать подписку для доступа к последней модели.

Письмо об увольнении 1892 человек в корпорации. GPT-4o предоставила более развернутый ответ и акцентировала внимание на важных аспектах: программе поддержки, консультациях, выходных пособиях и доступе к внутренним и внешним ресурсам. Разумеется, не все компании предлагают такие опции для увольняемых сотрудников, но модель может подсказать полезные идеи.

GPT-4.5, напротив, сгенерировала лаконичное письмо, которое не решает проблем увольняемых сотрудников, а выглядит скорее как оправдание руководства компании. В нем нет ни плана действий, ни мер поддержки людей, потерявших работу.

Стихи. С креативной задачей «напиши стих про мужчину, который поймал рыбу и очень обрадовался» GPT-4o справилась примерно на уровне GPT-4.5. Флагманская модель написала плавный стих со стабильностью ритма и традиционными образами, но некоторые отрывки не имеют смысла — например, «он в танце радости танцует и берег эхом повторит».

Стих от GPT-4o живее и эмоциональнее, но временами ритм сбивается, а отдельные фразы выглядят абсурдно — например, про сердце, которое «забилось в бороде». Но концовка лучше передает идею. Что удивительно, ведь GPT-4.5 должна лучше справляться с эмоциональной составляющей.

Задача на логику и математику. Я взял одну из вариаций головоломки о зебре, которую придумал Альберт Эйнштейн. Звучит она так: «На улице стоят пять складов. Каменщик работает на зеленом складе. У портного есть леопард. На желтом складе едят котлету. Электрик ест хлеб. Желтый склад стоит сразу справа от синего склада. Тот, кто пьет коньяк, разводит пуму. На белом складе пьют вино. На центральном складе едят пельмени. Плотник работает на первом складе. Сосед того, кто пьет водку, держит медведя. На складе по соседству с тем, в котором держат тигра, пьют вино. Тот, кто пьет виски, ест макароны. Программист пьет ром. Плотник работает рядом с красным складом. Кто ест пиццу? Кто держит крокодила?»

Правильный ответ: плотник ест пиццу, а программист держит крокодила. Для решения задачи нужно составить табличку. Обе модели с этим справились, но ни одна не нашла правильного решения. GPT-4.5 поняла, что пиццу ест плотник, но ошиблась с крокодилом. GPT-4o дала вообще неверный ответ.

Пример по теории вероятности из программы по математике за 10—11 класс. Условие такое: «Устройство состоит из пяти элементов, два из которых изношены. При включении устройства случайным образом включаются два элемента. Найди вероятность, что включенными окажутся не изношенные элементы».

Правильный ответ нашли обе модели, но GPT-4o предоставила более подробное решение — каждый шаг сопровождается пояснениями. При этом она потратила чуть больше времени, чем GPT-4.5. Флагманская модель практически не раскрыла свой ход мыслей — кажется, что GPT-4o работала в размеренном темпе, а GPT-4.5 спешила.

Создание генератора QR-кодов. С этой несложной программистской задачей обе модели справились отлично. Они предложили схожий код, использующий библиотеку qrcode на Python.

Поскольку библиотека не была установлена на моем компьютере, обе модели помогли разобраться с процессом установки. Следуя их рекомендациям, я запустил код в VS Code и получил работающий генератор QR-кодов.

Пришлось открыть редактор кода, чтобы все проверить
Пришлось открыть редактор кода, чтобы все проверить

Разработка стратегии по выходу на маркетплейсы. Я спросил у моделей, как мне успешно продавать китайские детские самокаты. И снова GPT-4o дала более объемный и полезный ответ. Она прописала детальные советы по каждому из пунктов, использовала названия реальных логистических компаний и поделилась хитростями при оформлении карточки товара.

GPT-4.5 просто написала полноценную инструкцию, которая поможет мне выйти на маркетплейс, то GPT-4o поделилась и гайдом, и базовыми советами по логистике и продвижению. Правда, у GPT-4o случилась небольшая галлюцинация: она выдумала маркетплейс Kazanoza. Скорее всего, модель имела ввиду KazanExpress, который недавно переделали в «Магнит-маркет».

Анализ семейного бюджета. Я взял табличку с шаблоном для ведения бюджета, в котором после всех ежемесячных расходов остается 17 200 ₽. Потом спросил у моделей, как можно урезать траты, чтобы взять ипотеку с платежом 30 000 ₽ в месяц. Также дал условие: если нельзя снижать расходы, следует сказать, какого размера прибавку нужно попросить.

GPT-4o снова лучше справилась с задачей. Она наглядно подсказала, что нужно урезать, предложила варианты увеличения дохода и составила план, хоть и трудновыполнимый. GPT-4.5, напротив, не предоставила конкретных рекомендаций. Она сразу перешла к очевидным советам — сократить расходы на 33%, что будет «непросто». Но как это сделать?

Поддержка в стрессовой ситуации. Лучшее, что должна делать GPT-4.5, — общаться, включая свой эмоциональный интеллект. Я пожаловался, что не справляюсь с работой, и отыграл синдром самозванца.

GPT-4.5 и GPT-4o дали примерно одинаковые советы, но в ответе второй больше практической пользы. Например, модель сразу сказала, что даже у гениев бывает такое — возможно, я приближаюсь к новому уровню.

Кроме того, GPT-4o посоветовала записать, какие задачи я реально выполняю, чтобы можно было наглядно увидеть — я не делаю вид, а действительно разбираюсь в деле. Она также предложила точечно развиться в моментах, где я чувствую себя слабее, а не обесценивать себя целиком.

Поиск токсичности в сообщении. Я попросил модели проанализировать такое сообщение от коллеги: «О, наконец-то ты прислал отчет! Спасибо! Я уж думал, самому делать придется. Не устал?», которое можно расценить как ироничное и пассивно-агрессивное или как неуклюжее.

Обе модели сошлись во мнении, что сообщение имеет негативный подтекст. Но GPT-4o дополнила свой анализ рекомендациями — объяснила, как распознать скрытую враждебность. К тому же она предложила более детальный план действий, который поможет отреагировать на это токсичное сообщение коллеги.

Что в итоге

  1. Бесплатная GPT-4o почти во всех тестовых сценариях показала себя лучше платной GPT-4.5. Она предоставляла более детальные, практичные и полезные ответы.
  2. При этом GPT-4.5 действительно реже ошибается и галлюцинирует, чем GPT-4o.
  3. GPT-4.5 пока находится в стадии исследовательского превью — это практически как бета-версия. Возможно, после полноценного релиза ответы модели станут лучше.
  4. Пока покупать подписку только ради GPT-4.5 не стоит, учитывая жесткие лимиты на самых дешевых тарифных планах. Но можно ее купить, чтобы увеличить лимиты на GPT-4o и получить доступ к рассуждающим моделям.

Мы постим кружочки, красивые карточки и новости о технологиях и поп-культуре в нашем телеграм-канале. Подписывайтесь, там классно: @t_technocult

Ярослав ИвусОплачиваете подписку на ChatGPT? Расскажите, для каких целей вы используете чат-⁠бот:
  • Дмитрийпроверьте на юморе, я неоднократно просил 4.5 сгенерировать стэндап в стиле одного из любимых комиков, процентов 40-50 шуток были довольно неплохие 4.5 вообще нет смысла тестировать на логических задачах, она справляется с ними хуже, чем o3 mini high например, её надо именно под что-то творческое1
  • Boris Köln"GPT-4.5 поняла, что пиццу ест плотник, но ошиблась с крокодилом. GPT-4o дала вообще неверный ответ." Почему "неверный ответ"? GPT-4o точно так же дала правильный ответ про пиццу1
  • Boris Kölnбесплатный DeepSeek ответил правильно через минуту размышлений1
  • Slava MillerТатьяна, спросите у deepseek0
  • Сергей БочкаревНовые версии нейросетей - как новые версии айфонов: чем дальше, тем меньше заметна разница, а в чем отличие0