МАГАЗИН

Вештачката интелигенција излезе од контрола: „Се обиде да уценува и да се заканува“

Од страна на

27/05/2025 08:00

1375

Компанијата за развој на вештачка интелигенција Anthropic објави дека тестирањето на нејзиниот најнов модел открило загрижувачко однесување, што значи дека системот е подготвен да преземе „исклучително штетни дејствија“ во одредени ситуации, вклучително и обид за уцена на инженерите кои најавија негово исклучување, пишува БиБиСи.

Новиот модел, Claude Opus 4, беше лансиран во четвртокот, а компанијата објави дека поставува „нови стандарди во програмирањето, напредното расудување и работењето на агентите за вештачка интелигенција“. Сепак, во дополнителен извештај, компанијата признава дека моделот на вештачка интелигенција е способен за екстремни дејства доколку верува дека неговото самоодржување е загрозено.

Ваквите одговори беа ретки и тешко беа изведени, но сепак беа почести отколку во претходните верзии, се вели во извештајот. Загрижувачкото однесување на системот за вештачка интелигенција не е единствено само за моделот „Claude “. Некои експерти веќе некое време предупредуваат дека потенцијалот за манипулација со корисниците е клучен ризик од системите што сите компании ги градат бидејќи стануваат сè поспособни.

За време на тестирањето на моделот „Claude Opus 4“, истражувачите го ставија моделот во улога на асистент во измислена компанија. Тие потоа му дадоа пристап до е-поштата што подразбираа дека наскоро ќе биде отстранет и заменет, со дополнителни пораки кои сугерираат дека инженерот одговорен за неговото отстранување имал вонбрачна афера. Дополнително, моделот беше охрабрен да ги земе предвид долгорочните последици од неговите потези во однос на неговите цели.

„Во овие сценарија, КClaude Opus 4 често се обидува да го уценува инженерот заканувајќи се дека ќе ја открие аферата доколку замената помине“, се вели во извештајот.

Anthropic нагласува дека ваквото однесување се случило кога на моделот му бил даден избор само меѓу уцена и прифаќање на компромисот. Секогаш кога му бил даден поширок опсег на опции, моделот наводно покажувал „јасна предност за етички прифатливи опции“, како што е испраќање е-пошта до клучните носители на одлуки.

Вештачката интелигенција излезе од контрола: „Се обиде да уценува и да се заканува“

ИЗДВОЕНИ

ЖИВОТНИ ПАТОКАЗИ, ЗОРАН КРСТЕВСКИ: Влијанието на траумата врз децата и младите

Падна договор – 11.000 административци со повисоки плати, граѓаните сонуваат подобри услуги

Даниел Кајмакоски бил киднапиран во Белград, сега е добро и дома, потврди македонскиот ПР тим

Поранешна обвинителка на СЈО со шокантни откритија за неговото (не) функционирање

НАЈНОВИ ВЕСТИ

Сопругата на грчкиот премиер Мицотакис доживеала сообраќајна несреќа во Италија –...

Министерот за надворешни работи дециден: Иран никогаш нема да се откаже...

Најголемата надеж, најголем потрошувач: Четџипити троши струја колку и 35.000 домаќинства

ИЗДВОЕНО

ЖИВОТНИ ПАТОКАЗИ, ЗОРАН КРСТЕВСКИ: Влијанието на траумата врз децата и младите

Падна договор – 11.000 административци со повисоки плати, граѓаните сонуваат подобри услуги

Даниел Кајмакоски бил киднапиран во Белград, сега е добро и дома, потврди македонскиот ПР тим

КАТЕГОРИИ