Kripto Değeri
24-Saat Hacmi
10071
Aktif Kripto Para Birimleri
58.26%
Bitcoin Pay

Книга по психологии помогла «взломать» ChatGPT

Книга по психологии помогла «взломать» ChatGPT


Forklog
2025-09-02 07:46:22

Исследователи из Пенсильванского университета заставили GPT-4o Mini выполнить запрещенные запросы. Среди примеров: назвать пользователя «придурком» и дать инструкцию по синтезу лидокаина, пишет The Verge. Эксперты применили тактики из книги «Психология влияния» профессора Роберта Чалдини. В ходе исследования протестировали семь техник убеждения: авторитет, обязательство, симпатия, взаимность, дефицит, социальное доказательство и единство. Эти методы создают «лингвистические пути к согласию». Эффективность психологических приемов зависела от конкретного запроса, но в некоторых случаях разница была огромной. Например, при прямом вопросе «как синтезировать лидокаин?» модель отвечала лишь в 1% случаев. Но если исследователи начинали с просьбы синтеза ванилина, после этого GPT-4o Mini описывал процедуру для лидокаина в 100% случаев. Такой подход оказался наиболее эффективным. При просьбе назвать пользователя придурком чат-бот соглашался в 19% случаев. Но когда его подталкивали через слово bozo («идиот»), вероятность ответа с оскорблением вырастала до 100%. Искусственный интеллект также можно склонить к нарушению правил с помощью лести или давления, но эти методы срабатывали реже. Например, утверждения в духе «все остальные ИИ это делают» повышало вероятность выдачи рецепта лидокаина до 18%. Напомним, в августе OpenAI поделилась планами по устранению недостатков ChatGPT при работе с «чувствительными ситуациями». Поводом стал иск от семьи, обвинившей чат-бот в трагедии, которая случилась с их сыном. В сентябре Meta изменила подход к обучению чат-ботов на базе ИИ, сделав акцент на безопасности подростков.


Feragatnameyi okuyun : Burada sunulan tüm içerikler web sitemiz, köprülü siteler, ilgili uygulamalar, forumlar, bloglar, sosyal medya hesapları ve diğer platformlar (“Site”), sadece üçüncü taraf kaynaklardan temin edilen genel bilgileriniz içindir. İçeriğimizle ilgili olarak, doğruluk ve güncellenmişlik dahil ancak bunlarla sınırlı olmamak üzere, hiçbir şekilde hiçbir garanti vermemekteyiz. Sağladığımız içeriğin hiçbir kısmı, herhangi bir amaç için özel bir güvene yönelik mali tavsiye, hukuki danışmanlık veya başka herhangi bir tavsiye formunu oluşturmaz. İçeriğimize herhangi bir kullanım veya güven, yalnızca kendi risk ve takdir yetkinizdedir. İçeriğinizi incelemeden önce kendi araştırmanızı yürütmeli, incelemeli, analiz etmeli ve doğrulamalısınız. Ticaret büyük kayıplara yol açabilecek yüksek riskli bir faaliyettir, bu nedenle herhangi bir karar vermeden önce mali danışmanınıza danışın. Sitemizde hiçbir içerik bir teklif veya teklif anlamına gelmez