OpenAI тестирует функцию ChatGPT, которая может предупреждать близких о рисках самоповреждения

OpenAI работает над новой функцией безопасности для ChatGPT, позволяющей предупреждать доверенное лицо пользователя в случае обнаружения признаков возможного риска самоповреждения или суицидальных мыслей. Об этом сообщают официальные материалы компании и технические СМИ.

Об этом пишет: Blik

Что это за функция

Новая опция получила название Trusted Contact («доверенный контакт»). Она позволяет взрослому пользователю добавить в свой аккаунт человека (второго, родственника или опекуна), который может получить сообщение в случае серьезных тревожных сигналов в разговоре с ChatGPT.

Если система и проверка модераторами определяют риск самоповреждения, ChatGPT может инициировать предупреждение для этого контакта.

Как работает система

Функция работает в несколько этапов:

автоматические системы анализируют разговор;
в случае потенциального риска прилагается проверка специалистами;
если риск подтверждается, избранному лицу посылается сообщение.

Уведомление содержит только общую информацию о возможном риске и призыве связаться с человеком, без деталей разговора или переписки. Это сделано для сохранения конфиденциальности пользователя.

Что именно получает доверенное лицо

Доверенный контакт не видит чаты или истории переписки. Он получает лишь короткое уведомление, что пользователь мог упоминать темы, связанные с риском самоповреждения, и рекомендацию проверить состояние человека.

Для кого доступна функция

Функция постепенно внедряется для взрослых пользователей личных аккаунтов ChatGPT. Она не обязательна и активируется только по желанию пользователя.

Почему OpenAI внедряет такие изменения

Разработка связана с усилением внимания к безопасности ИИ-систем. В компании отмечают, что иногда пользователи обращаются к чатам с очень чувствительными темами, и система должна не только отвечать, но и в случае необходимости помогать найти реальную поддержку.

Также OpenAI уже сталкивалась с критикой и судебными исками, связанными с тем, как чаты взаимодействуют с уязвимыми пользователями.

Итог

Новая функция не читает частных чатов посторонним людям и не передает полные разговоры. Ее цель – добавить «слой безопасности», который может помочь быстрее привлечь реальную поддержку в сложных ситуациях, не нарушая конфиденциальность пользователей.