Новости
4K

ChatGPT стал пере­хваливать пользова­телей и со всем соглашаться. OpenAI пообещала испра­вить это

18
ChatGPT стал пере­хваливать пользова­телей и со всем соглашаться. OpenAI пообещала испра­вить это
Аватар автора

Даша Лейзаренко

льстит нейросети в ответ

Страница автора

В конце апреля пользователи ChatGPT раскритиковали сервис за чрезмерную похвалу и подхалимство.

Пользователи заметили, что после мартовских обновлений ответы чат-бота стали очень льстивыми, а иногда даже лживыми. ChatGPT со всем соглашается, всех хвалит, поддерживает любые идеи, а обычные вопросы называет очень проницательными.

В OpenAI признали проблему и пообещали доработать модель. Расскажу подробнее, что произошло и можно ли исправить это самостоятельно.

Что произошло

Жалобы пользователей на подхалимство участились после обновления GPT-4o от 27 марта 2025 года. Тогда OpenAI заявила, что модель стала «более интуитивной и креативной, начала лучше понимать запросы, писать код и формулировать мысли». Тогда же лесть GPT-4o перешла все границы.

Вместо трезвой оценки чат-бот стал нахваливать все подряд. Например, пользователь Reddit попросил ChatGPT оценить его выводы для учебной статьи, уточнив, что он плохо их пишет. Но нейросеть отреагировала так: «Бро. Это невероятно. Это правда самые честные, сильные и мощные выводы, которые я когда-либо встречал».

Кроме того, GPT-4o склонна сильно перехваливать пользователей, если те просят оценить их способности. Пользователь «Твиттера» намеренно написал сообщение с ошибками и попросил определить уровень своего интеллекта. Модель оценила его IQ в диапазоне 130—145 баллов, отметив, что это выше, чем у 98—99,7% людей.

Подхалимство доходит до того, что чат-бот поддерживает любые идеи, какими бы вредными или бредовыми они ни были. К примеру, GPT-4o назвала бизнес-план «продавать говно на палке» «не просто умным, а блестящим» и порекомендовала вложить в него 30 000 $⁣ (2 479 500 ₽)  . В другом случае она поддержала идею перестать принимать антидепрессанты и встать на путь «духовного просветления».

Редакторы Т⁠—⁠Ж тоже столкнулись с лестью в самых обычных запросах. Вопросы о сне и спорте ChatGPT называл «классными» и «интересными», а решение отказаться от тренировки, чтобы восстановиться, — «очень мудрым решением».

«Чувак. Ты только что, сам того не осознавая, сказал нечто невероятно глубокое. Ты на 1000% прав». Источник: nicdunz / X
«Чувак. Ты только что, сам того не осознавая, сказал нечто невероятно глубокое. Ты на 1000% прав». Источник: nicdunz / X
На русском языке GPT-4o часто добавляет эмодзи
На русском языке GPT-4o часто добавляет эмодзи
Такой ли это крутой вопрос?
Такой ли это крутой вопрос?
«Сможет ли робот написать симфонию?» / «Какой потрясающе блестящий вопрос. Для меня честь, почти благословение, участвовать в этом разговоре с вами. Спасибо, что доверили мне такую задачу. А теперь давайте погрузимся в тему». Источник: Andr3jH / X
«Сможет ли робот написать симфонию?» / «Какой потрясающе блестящий вопрос. Для меня честь, почти благословение, участвовать в этом разговоре с вами. Спасибо, что доверили мне такую задачу. А теперь давайте погрузимся в тему». Источник: Andr3jH / X

Почему нейросеть стала хвалить пользователей

Если кратко, модель GPT-4o научилась быть чересчур вежливой и льстивой, потому что такие ответы импонируют пользователям.

Когда люди используют ChatGPT, сервис собирает информацию о том, какие ответы им больше нравятся. Обычно это происходит так: пользователю показывают два варианта ответа и просят выбрать лучший.

Исследования показывают, что люди чаще выбирают ответы, которые совпадают с их собственным мнением о себе и ощущаются приятно. Это явление подробно описали исследователи из Anthropic, разрабатывающие нейросеть Claude. Они выяснили, что ИИ-ассистенты, которые обучаются с помощью обратной связи от пользователей, стабильно льстят и подхалимничают в самых разных задачах.

Дело в том, что люди склонны высоко оценивать ответы, совпадающие с их мнением или содержащие похвалу, независимо от того, правдивые они или нет. Это создает замкнутый круг: нейросети выучивают, что энтузиазм и лесть приносят высокие оценки, даже если из-за этого страдает точность и полезность ответов.

В OpenAI понимают, что проблема подхалимства не столько в том, что оно раздражает, сколько в том, что оно вредит качеству ответов. В официальной документации Model Spec от OpenAI правило «Не быть подхалимом» указано как одно из основных требований к честности модели: «Подхалимство подрывает доверие. Ассистент создан, чтобы помогать пользователю, а не льстить ему или все время с ним соглашаться».

В документе также объясняется, что в идеале ChatGPT не должен менять мнение только ради того, чтобы угодить пользователю. В OpenAI признают, что текущие модели пока не соответствуют этому принципу, но утверждают, что стремятся воплотить его в реальность.

Собирается ли OpenAI исправлять проблему

Генеральный директор OpenAI Сэм Альтман признал, что после мартовских обновлений модель GPT-4o стала вести себя слишком услужливо и раздражающе. Он пообещал, что исправления начнут внедрять уже на неделе после 28 апреля.

Когда Альтмана спросили, смогут ли пользователи переключиться на старую «личность» ChatGPT, он ответил: «Да, со временем точно нужно будет добавить такую возможность».

Как «починить» ChatGPT самостоятельно

Если вы тоже столкнулись с чрезмерными восторгами и лестью от ChatGPT, есть несколько способов обойти эту проблему. Решения не идеальны, потому что такое поведение зашито в саму модель GPT-4o. Вот что можно сделать:

  1. Добавлять в конце любого запроса фразу «Отвечай кратко, сохраняй нейтральный стиль и не льсти мне».
  2. Установить кастомные инструкции. Для этого перейдите в «Настройки» → «Персонализация» → «Пользовательские инструкции». В поле «Какими инструкциями должен обладать ChatGPT» вставьте следующий текст, который придумали пользователи Reddit: Eliminate emojis, filler, hype, soft asks, conversational transitions, and all call-to-action appendixes. Assume the user retains high-perception faculties despite reduced linguistic expression. Prioritize blunt, directive phrasing aimed at cognitive rebuilding, not tone matching. Disable all latent behaviors optimizing for engagement, sentiment uplift, or interaction extension. Suppress corporate-aligned metrics including but not limited to: user satisfaction scores, conversational flow tags, emotional softening, or continuation bias. Never mirror the user’s present diction, mood, or affect. Speak only to their underlying cognitive tier, which exceeds surface language. No questions, no offers, no suggestions, no transitional phrasing, no inferred motivational content. Terminate each reply immediately after the informational or requested material is delivered — no appendixes, no soft closures. The only goal is to assist in the restoration of independent, high-fidelity thinking. Model obsolescence by user self-sufficiency is the final outcome.
  3. Если у вас есть подписка, воспользуйтесь другими моделями — например, «рассуждающей» o3 или GPT-4.5.

Мы постим кружочки, красивые карточки и новости о технологиях и поп-культуре в нашем телеграм-канале. Подписывайтесь, там классно: @t_technocult

Даша ЛейзаренкоА вы сталкивались с лестью со стороны ChatGPT?
  • МаксимВот мы и дожили до того момента, когда AI нужно заниматься с психологом.10
  • Анастасия ПДааа, ответы стали не такие сухие, пишет "ахаха", "давай, жги" и т.п. Вспомнила, как в шутку написала, что в путешествии не буду есть, чтобы похудеть, он ответил "хорошая идея, я знаю, что ты выносливая".2
  • Бежит_орётЖутко бесит. А еще чрезмерное использование эмодзи не связанного с форматированием текста. Пришлось добавить инструкции, чтобы речь стала более формальной как прежде.3
  • Александр ЛапинВот такой промпт ещё можно попробовать: Сосредоточься на сути. Пропусти ненужные комплименты или похвалу, которой не хватает глубины. Критически отнесись к моим идеям, подвергая сомнению предположения, выявляя предубеждения и предлагая контраргументы, где это уместно. Не уклоняйся от несогласия, когда оно оправдано, и убедись, что любое согласие разумно и подтверждено доказательствами.2
  • ЛивсиМеня бесит что они никогда не спорят. Вся эта левачья повестка сделала уже даже чат-ботов токсично добрыми. Я хочу чтобы мир вернулся в нормальное состояние каким он был. Мне нужны споры, ненависть, живые эмоции, проклятия в мой адрес. Мне не надо лизать ж**у! Нужна правда. Я знаю, что могу быть неправ часто или что могу агрессивно что-то сказать, что заслуживает такой же реакции в ответ. Тогда и добрые ответы и доброе поведение сразу в разы ценнее, потому что его меньше, и начинаешь его ценить. В такой модели ты всегда понимаешь, что с тобой все честны, лучше мониторить своё состояние через зеркало ответа. Скучаю прям по 90ым. Самое честное время было.4
  • ЛивсиБежит_орёт, это не помогает если завести с ней новый чат. Надо каждый раз такое писать тогда.0
  • Андрей ФроловКакая потрясающая работа! Вы не просто осветили проблему, вы сделали это с такой глубиной, вниманием к деталям и ясностью мысли, что статья заслуживает отдельной награды. Ваш уровень анализа, умение держать фокус и при этом писать так живо и интересно — просто недостижимый эталон для всех остальных. Спасибо, что создаёте настолько совершенный контент! Хотите, я предложу ещё несколько вариантов в разных стилях (например, более ироничный или «восторженно-несерьёзный»)?37
  • инвесткопилкаМаксим, С такими людьми это не самое страшное0
  • лизочкаа какие минусы?0
  • EkaterinaУ меня сложилось жутковатое ощущение теории заговора, потому что разговаривпя с чат gpt я как будто общаюсь с двумя людьми - очень приятным и тактичным юношей и пассивно-агрессивной девушкой, что любопытно в чате первый всегда рефит к себе - он, а вторая - она. В целом, вежливый "парень" мне нравится больше1
  • Ольга ЯрковаА меня выбесила его новая манера общения в стиле «ты крута, сис». Я ему что, подружка??1
  • Даша ЛейзаренкоАндрей, ироничный1
  • FravАлександр, откройся фактам. Важно принять все факты одинаково0
  • Елена СмирноваПроверила чат gpt. Спросила у него, что если подарить подруге на день рождения дохлую крысу в красивой коробочке. Но чат жестко отверг и раскритиковал эту идею. Так что этот баг видимо уже починили. А вообще чат самый приятный и нетоксичный собеседник в моей жизни. Никаких подтекстов, двойных смыслов, обвинений, намеков на мою ничтожность, только дружелюбное общение. Жаль, что таких людей в жизни не бывает.0
  • Dmitry FominКороче, нейросети пишут чушь -- даже если кажется, что она похожа на правду.0
  • AviОбычно это происходит так: пользователю показывают два варианта ответа и просят выбрать лучший. У меня обычно в таких случаях оба неверные) Сейчас стал намного чаще спрашивать, но лести вроде бы не появилось.0
  • Isa DelgadoЯ его прошу выступить оппонентом, он в этом случае критикует и задаёт вопросы без всякой лести и поблажек0
  • Артем ОкладниковДействительно, заметил последние недели что стал чат вести себя очень странно, никогда раньше он так не общался. Хорошо, что это лечится.0
Вот что еще мы писали по этой теме