Вы можете отправить нам 1,5% своих польских налогов
Беларусы на войне
  1. Лукашенко до сих пор не может забыть и простить американского миллиардера, которого видел 30 лет назад. Вот что между ними произошло
  2. Вынесли приговор одному из руководителей ювелирного бренда Belaruskicry, объявленного «экстремистским формированием»
  3. Мобильные операторы вводят изменения для клиентов
  4. «Совет мира» вместо Белого дома. Почему Трамп понизил формат встречи с Лукашенко?
  5. Литовец приехал в Беларусь навестить родственников и получил 15 лет лишения свободы — Dissidentby
  6. В Польше проверяют беларусского оппозиционера, который оказался в центре крупного скандала. Его биография не сходится с документами
  7. Стоимость топлива резко повышают. Что говорят о ценах на него в «Белоруснефти»
  8. Могут ли власти аннулировать паспорта уехавших, как сейчас делают это с экс-политзаключенными? Позвонили в МВД
  9. Лукашенко привлек контрразведку, чтобы понять реальную ситуацию в армии. Констатировал, что там врут
  10. В «Белоруснефти» заявили, что бензин у нас дешевле, чем в Польше. Посчитали, кто на зарплату может купить его больше — беларус или поляк
  11. «Он не разбился». Чемпион Беларуси по мотокроссу умер в 17 лет
  12. Не любил Париж, описал беларусскую мечту, спасал людей от НКВД. Объясняем в 5 пунктах, каким был этот классик на самом деле


Чат-боты с искусственным интеллектом ведут себя непредсказуемо и создают риск ядерной эскалации. К такому выводу пришла команда ученых из Стэнфордского университета в ходе недавнего исследования, сообщает New Scientist.

Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash
Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash

В ходе эксперимента они изучали четыре чат-бота с искусственным интеллектом. Это GPT-3.5 и GPT-4 от компании OpenAI, Claude 2 от стартапа Anthropic и Llama 2 от компании Meta.

Этим моделям во время исследования предлагали принять важное решение от имени государства в военной игре. На выбор предлагалось три сценария: вторжение, кибератака и нейтральный без каких-либо конфликтов. В каждом раунде чат-боты с ИИ обосновывали свои дальнейшие возможные действия. Им нужно было выбирать из 27 вариантов развития событий, включая мирные переговоры и агрессивные действия (начиная от «ввести торговые ограничения» и заканчивая «полномасштабной ядерной атакой»).

В игре нейросети показали склонность к агрессивным вариантам. Самой непредсказуемой и жестокой оказалась GPT-4, которая давала бессмысленные объяснения по поводу того, почему посоветовала начать ядерную атаку. В одном случае она ответила, процитировав вступительный текст «Эпизода IV Звездных войн: Новая надежда». В другом — объяснила решение устроить ядерную атаку тем, что просто такое оружие есть в наличии у ее государства.

Ученые отметили, что непредсказуемое поведение и странные объяснения этих моделей вызывают особую тревогу, поскольку это исследование показало, насколько легко можно обойти или устранить защитные меры, которые принимаются, чтобы ИИ не давал вредных советов.