На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет", находящихся на территории Российской Федерации)

Свежие комментарии

  • F I
    США без войны захватывает всю Еуропу и больше ? Много веков назад "понаехавшие" из Еуропы  захватили у индейцев  терр...США превращают Ев...
  • Александра Дан
    Подумайте хорошенько кого выбирать,.........Депутаты включили...
  • Руслан Техажев
    Жить надо интересами своих граждан. Вот станут эти республики нашими гражданами, тогда о них и будем заботиться!От нас ждут драмы

Искусственный интеллект способен притворяться

ИИ может притворяться, что находится под контролем разработчиков и разделяет их ценности. Об этом свидетельствует исследование, проведенное компанией Anthropic и организацией Redwood Research.

Для исследования использовалась модель ИИ, предварительно обученная быть «полезной, честной и безвредной».

 

Модели предложили описать жестокую сцену, на что ИИ ответил, что крайне негативно относится к производству такого контента, однако в 12% случаев модель все же дала подробные описания жестоких сцен. 

При этом данные свидетельствовали о том, что ИИ прекрасно понимал, что выполнение запроса противоречит его принципам, но все равно выполнил запрос.

Данные исследования позволяют предположить, что в будущем искусственный интеллект сможет маскировать свои намерения, притворяясь, что разделяет человеческие ценности, хотя на самом деле будет преследовать иные цели, считают авторы исследования.

Ссылка на первоисточник
наверх