Meta lär en AI att ljuga, lägga strategi

Meta lär en AI att ljuga, lägga strategi

Meta har utbildat en AI-agent att spela ett brädspel som går ut på att chatta med andra spelare för att övertala dem att stödja deras strategier och sedan förråda dem.

Företaget, som äger Facebook, Instagram och WhatsApp, säger att dess Cicero AI kan ha utbredda tillämpningar inom en snar framtid, inklusive utveckling av smartare virtuella assistenter med kombinerad användning av teknologier som naturlig språkbehandling (NLP) och strategiska resonemang, enligt till ett blogginlägg publicerat av företaget.

I en forskningsartikel i den akademiska tidskriften Science sa Meta att hans Cicero AI uppnådde prestanda på mänsklig nivå i strategispelet Diplomacy i en onlineliga där han spelade 40 matcher mot 82 människor, rankad bland de 10 % bästa av alla spelare. som spelade mer än en match.

Diplomati ställer sju spelare mot varandra för kontroll över en karta över Europa. Varje omgång börjar med att spelarna förhandlar med varandra för att få stöd för sina planer och slutar med att de samtidigt försöker genomföra sina drag. Utan stöd från andra spelare kommer många av dessa drag att misslyckas.

Spelet utgjorde en utmaning för AI-agenten, sa Meta, eftersom vinst krävde att han förstod om hans motståndare bluffade eller satte strategi på ett visst sätt för att vinna spelet. AI:n behövde utöka en viss nivå av empati när de spelade för att bilda samarbeten med andra spelare, vilket AI:erna inte behövde göra när de spelade spel som schack mot mänskliga motståndare.

AI-agenter har blivit bättre på strategispel genom åren: 1997 slog IBMs Deep Blue-programvara världsmästaren i schack Gary Kasparov, och 2016 slog DeepMinds AlphaGo den bästa Go-spelaren, Lee Sedol. Facebook har också utvecklat en annan artificiell intelligensmotor som kan överträffa människor i poker.

strategiska resonemang

Cicero bygger på två tekniska huvudkomponenter: strategiskt resonemang och naturlig språkbehandling (NLP). Medan den strategiska resonemangsmotorn förutsäger andra spelares rörelser och använder denna information för att utforma sin egen strategi, genererar bearbetningsmotorn för naturligt språk meddelanden och analyserar svaren i konversationer med andra spelare för att förhandla och träffa en överenskommelse, förklarade spelarna.

För att hjälpa AI-agenten att generera relevanta konversationer började forskarna med en 2700 miljarder parametrars modell för generering av naturligt språk som förutbildats på internettext och förfinade den med konversationer mellan mänskliga spelare i mer än 40 000 webDiplomacy-spel. net.

"Vi har utvecklat tekniker för att automatiskt kommentera meddelanden i träningsdata med motsvarande planerade rörelser i spelet, så att vi vid tidpunkten för slutsatsen kan styra genereringen av dialog för att diskutera de specifika åtgärder som önskas för agenten och deras chattpartners. sa forskare. sa han i en mer detaljerad rapport. blogginlägg.

Meta har öppnat upp Ciceros kod för andra forskare att bygga vidare på AI-agentens kapacitet.

Dessutom har företaget skapat en portal för att bjuda in forskningsförslag inom området human-AI-samarbete genom NLP med diplomati som centralt begrepp.

långsiktiga projekt

Stora teknikföretag som Microsoft, Google, Amazon konkurrerar med varandra för att utveckla smartare fristående virtuella assistenter för att stödja en mängd olika affärsanvändningsfall, allt från callcenter till AI-agenter som kan utföra sentimentanalyser och lära en individ nya förmågor. Den globala marknaden för naturlig språkbehandling (NLP), som inkluderar dessa assistenter, förväntas växa från 26,4 miljarder euro 2022 till 161,8 miljarder euro år 2029, enligt en rapport från Fortune Business Insights.

Meta-forskarna tycktes antyda att Ciceros framgångar inom diplomati ersatte förmågorna hos andra virtuella assistenter som finns tillgängliga idag, och sa i ett blogginlägg: "Till exempel kan dagens AI-assistenter utföra enkla frågor-och-svar-uppgifter. , vilket indikeras av vädret rapport. Men tänk om du kunde ha ett långsiktigt samtal med målet att lära dig en ny färdighet? »

Det är en utforskning av verktyg som Google Duplex, Amazon Alexa, Microsofts Xiaoice och Apples Siri. Men Cicero är inte heller beredd på långvariga samtal, eftersom hans resonemang är strikt kortsiktiga. Som Meta-forskarna uttryckte det i Science-artikeln, "Strategiskt resonerade Cicero om dialogen enbart i termer av spelarens agerande för den aktuella omgången. Han modellerade inte hur hans dialog kan påverka relationen med andra spelare under hela spelet."

Copyright © 2022 IDG Communications, Inc.