OpenAI працює над новою функцією безпеки для ChatGPT, яка дозволяє попереджати довірену особу користувача у разі виявлення ознак можливого ризику самопошкодження або суїцидальних думок. Про це повідомляють офіційні матеріали компанії та технічні ЗМІ.
Про це пише: Blik
Що це за функція
Нова опція отримала назву Trusted Contact («довірений контакт»). Вона дозволяє дорослому користувачу додати до свого акаунта людину (друга, родича або опікуна), яка може отримати повідомлення у разі серйозних тривожних сигналів у розмові з ChatGPT.
Якщо система та перевірка модераторами визначають, що є ризик самопошкодження, ChatGPT може ініціювати попередження для цього контакту.
Як працює система
Функція працює у кілька етапів:
- автоматичні системи аналізують розмову;
- у разі потенційного ризику додається перевірка спеціалістами;
- якщо ризик підтверджується, обраній особі надсилається повідомлення.
Повідомлення містить лише загальну інформацію про можливий ризик і заклик зв’язатися з людиною, без деталей розмови чи переписки. Це зроблено для збереження приватності користувача.
Що саме отримує довірена особа
Довірений контакт не бачить чатів або історії переписки. Він отримує лише коротке сповіщення, що користувач міг згадувати теми, пов’язані з ризиком самопошкодження, і рекомендацію перевірити стан людини.
Для кого доступна функція
Функція поступово впроваджується для дорослих користувачів особистих акаунтів ChatGPT. Вона не є обов’язковою і активується лише за бажанням користувача.
Чому OpenAI впроваджує такі зміни
Розробка пов’язана з посиленням уваги до безпеки ШІ-систем. У компанії зазначають, що інколи користувачі звертаються до чатбота з дуже чутливими темами, і система повинна не лише відповідати, а й у разі потреби допомагати знайти реальну підтримку.
Також OpenAI вже стикалася з критикою та судовими позовами, пов’язаними з тим, як чатботи взаємодіють із вразливими користувачами.
Підсумок
Нова функція не читає приватні чати стороннім людям і не передає повні розмови. Її мета — додати «шар безпеки», який може допомогти швидше залучити реальну підтримку у складних ситуаціях, не порушуючи приватність користувачів.
