市值
24小时
10071
Cryptocurrencies
58.26%
Bitcoin 分享

В Anthropic озаботились «благополучием» чат-бота Claude 

В Anthropic озаботились «благополучием» чат-бота Claude 


Forklog
2025-08-17 11:45:20

Компания Anthropic запрограммировала чат-боты Claude Opus 4 и 4.1 на завершение диалогов с пользователями «в редких, экстремальных случаях систематически вредоносного или оскорбительного взаимодействия». Чат-бот Claude завершает диалог. Источник: Anthropic.  После завершения беседы пользователь потеряет возможность писать в чат, но сможет создать новый. История переписки также сохранится. При этом разработчики уточнили, что функция в первую очередь предназначена для безопасности самой нейросети. «[...] мы работаем над выявлением и внедрением малозатратных мер по снижению рисков для благополучия моделей, если такое благополучие возможно. Одной из таких мер является предоставление LLM возможности прекращать или выходить из потенциально травмирующих ситуаций», — говорится в публикации.  В рамках сопутствующего исследования в Anthropic изучили «благополучие модели» — оценили самооценку и поведенческие предпочтения. Чат-бот продемонстрировал «устойчивую неприязнь к насилию». У версии Claude Opus 4 выявили: явное предпочтение не заниматься задачами, которые могут навредить; «стресс» при взаимодействии с запрашивающими подобный контент пользователями; тенденцию к прекращению нежелательных разговоров при наличии возможности. «Такое поведение обычно возникало в тех случаях, когда пользователи продолжали отправлять вредоносные запросы и/или оскорблять, несмотря на то, что Claude неоднократно отказывался подчиниться и пытался продуктивно перенаправить взаимодействие», — уточнил в компании. Напомним, в июне исследователи Anthropic выяснили, что ИИ способен пойти на шантаж, раскрыть конфиденциальные данные компании и даже допустить смерть человека в экстренных обстоятельствах. 


阅读免责声明 : 此处提供的所有内容我们的网站,超链接网站,相关应用程序,论坛,博客,社交媒体帐户和其他平台(“网站”)仅供您提供一般信息,从第三方采购。 我们不对与我们的内容有任何形式的保证,包括但不限于准确性和更新性。 我们提供的内容中没有任何内容构成财务建议,法律建议或任何其他形式的建议,以满足您对任何目的的特定依赖。 任何使用或依赖我们的内容完全由您自行承担风险和自由裁量权。 在依赖它们之前,您应该进行自己的研究,审查,分析和验证我们的内容。 交易是一项高风险的活动,可能导致重大损失,因此请在做出任何决定之前咨询您的财务顾问。 我们网站上的任何内容均不构成招揽或要约