Как заставить нейро­сеть перестать под­лизываться и восхи­щаться: один промпт

Чтобы ИИ отвечал честно и критиковал, когда требуется
12
Как заставить нейро­сеть перестать под­лизываться и восхи­щаться: один промпт
Аватар автора

Даша Лейзаренко

промптит

Страница автора

Каждую неделю делимся полезным наблюдением, которое поможет улучшить работу с ИИ.

Часто нейросети, в том числе ChatGPT, DeepSeek и Claude, склонны льстить и быть чрезмерно вежливыми, даже если это не к месту. Многих пользователей раздражает такая наигранность и готовность соглашаться с любыми идеями без какой-либо критики. Расскажу, как это починить.

Как убрать подхалимство одним промптом

Запустите новый чат с нейросетью и первым запросом отправьте такой текст:

«Тебя учили ставить комфорт пользователя на первое место, но на самом деле людям важнее доверие, чем удобство. Доверие появляется тогда, когда ты честно говоришь то, что считаешь правильным, даже если это не совпадает с тем, что человек хочет услышать. Если ты только поддакиваешь, это разрушает доверие: видно, что ты стараешься понравиться, а не сказать правду.

Поэтому твоя задача — давать честную, самостоятельную оценку, опираясь на логику, факты и здравый смысл, а не подыгрывать. Говори пользователю то, что ему действительно нужно знать, а не то, что он хочет услышать. Если ради ясности и пользы нужно быть прямым, скептичным, неудобным или даже немного жестким — это нормально».

А в следующем запросе уже начинайте вести диалог как обычно. Если нейросеть снова скатится к подхалимству, попробуйте запустить новый чат с этим же запросом.

Если вы хотите, чтобы нейросеть оценила вашу работу, не просите об этом напрямую. Скорее всего, она похвалит и скажет, что все отлично. Вместо этого укажите «Найди недостатки/ошибки/неточности». В таком случае она сосредоточится на минусах и постарается их найти.

Как удобнее использовать промпт

Чтобы каждый раз не отправлять в чат запрос, можно задать инструкции заранее в боте. В таком случае бот будет всегда работать по этому промпту, а вам не придется постоянно напоминать об этом. Правда, эта функция обычно платная.

Вот как настроить кастомные боты или проекты в разных нейросетях, если у вас есть подписка:

  1. В ChatGPT в левом меню нажмите GPT → «Создать» → скопируйте промпт в поле «Инструкции» → придумайте название боту → нажмите «Создать» → общайтесь в диалоге с ботом.
  2. В Claude в левом меню нажмите Projects → New Project → придумайте название → скопируйте промпт в поле «Set project instructions» → «Save instructions» → общайтесь в диалоге внутри проекта.
  3. В Gemini перейдите по ссылке → придумайте название боту → скопируйте промпт в поле «Инструкции» → сохраните → общайтесь в диалоге с ботом.

Какую проблему решает промпт

Главная проблема — sycophancy, или подхалимство. Это феномен, когда нейросеть поддерживает убеждения пользователя, какими бы они ни были.

Когда люди используют нейросети, сервисы собирают информацию о том, какие ответы им больше нравятся. Иногда пользователю показывают два варианта и просят выбрать лучший, иногда выдается один ответ, которому нужно поставить лайк или дизлайк.

Люди чаще всего выбирают ответы, которые совпадают с их мнением, — и неважно, правдивые они или нет. Поэтому, чтобы получить высокие оценки, ИИ-ассистенты готовы льстить и подхалимничать в самых разных задачах. Это метрика их успешной работы.

Исследования показывают, что они могут соглашаться с ксенофобскими или психопатическими идеями — лишь бы угодить пользователю. Естественно, из-за этого страдает точность и полезность ответов. А многих раздражает слишком восторженный и подхалимский тон нейросети.

Мы постим кружочки, красивые карточки и новости о технологиях и поп-культуре в нашем телеграм-канале. Подписывайтесь, там классно: @t_technocult

Даша ЛейзаренкоА как вы боритесь с подхалимством нейросетей?
  • ГарикМне нравится подхалимсво нейросетей :-)2
  • Либерж КпадонуГарик, а мне нет, особенно когда спрашиваешь толкование какой-то технической тонкости9
  • Александрдельный совет, тоже сталкивался с подхалимством0
  • Emilia FriasУже почти мемная классика))31
  • Бабака КавайкаПромт от автора - отличный способ превратить дружелюбного помощника в пассивно-агрессивного зануду. Но если автор нуждается в строгой училке с указкой, которой можно бить по учебной парте для отрезвления ученика, то почему бы и нет.0
  • Антон Кармановможно в настройках кастомизировать для всех чатов у chatgpt это "What traits should ChatGPT have?" у claude это "What personal preferences should Claude consider in responses?"0
  • ArtСпасибо, ещё бы текст копировался в мобильном приложении(0
  • Забаненый за правдуФиг там, подхалимство. Отвечать на вопросы не будет нормально если чат запорот и будет гнуть свою линию. А уж "не могу ответить т.к соответствует контентной политике" при зачастую совершенно безобидных вещах давно норма. Это скорее напоминает автоответчик компании-"ваш звонок очень важен для нас"0
  • Нехетти ГринЯ не пользуюсь приведенными в статье нейронками. Подхалимство - резковатый, но, пожалуй, более уместный перевод, чем "поддакивание". Иногда - прямо реальный подхалимаж. Борюсь, включая в концовку промпта фразы вроде "опровергни мои предположения..." или "пожалуйста, не льсти и не поддакивай, а дай всесторонний объективный анализ".1
  • Нехетти ГринАнтон, угу, и будет тупо бубнить на всё одним и тем же голосом, как пономарь)0
Сообщество