Czat bot wygrywa w Dyplomację

Firma Meta (Facebook) stworzyła czatbota-dyplomatę. Eksperyment został opisany w tej pracy, opublikowanej w Science. Algorytmowy dyplomata nie potrafiłby poprowadzić negocjacji między państwami, ale na poziomie mistrzowskim gra w „Dyplomację”. To ciekawa gra planszowa, wymyślona w latach 50-ych XX wieku, która polega na rozmawianiu i na planowaniu podbojów. Gra rozpoczyna się w roku 1900 i z naszego, polskiego punktu widzenia jest w zasadzie grą w rozbiory.

Czatbot Cicero potrafi się adaptować do warunków i na podstawie wiadomości od innych grających zmienia swoje posunięcia. Ma więc plan tworzony w warunkach niepełnej informacji, w warunkach niestabilnych, ma pamięć i względną elastyczność. Czego nie ma? Dlaczego nie wygrałby z ludźmi w każdych warunkach i czemu ten „dyplomata” nie zastąpi żywych dyplomatów w świecie realnej polityki?

„Dyplomacja” to gra zainspirowana historią wojen i sojuszy w Europie. Gra w nią polega na planowaniu i realizowaniu podbojów.

Ilustracja: Bing Image Creator

Przepisy w dużym skrócie wyglądają tak:
– losujemy, jakim państwem europejskim jesteśmy a następnie budujemy potęgę militarną poprzez zajmowanie kluczowych terytoriów na mapie.
– gra jest dla 2-7 graczy, ale dość powszechnie twierdzi się, że najlepiej grać w 4 lub więcej osób.
– terytoria zajmujemy przesuwając oddziały lub okręty.
– od liczby terytoriów zależy liczba naszych oddziałów. Jeśli państwa spierają się o dane terytorium, to automatycznie wygrywa państwo mające większą liczbę oddziałów.
– zajęcie terytorium oznacza wzrost potęgi militarnej, czyli wzrost liczby oddziałów.

Gra dzieli się na tury. Są tury działań i tury dyplomacji. W turze dyplomacji zawiązujemy sojusze poprzez wysyłanie do siebie wiadomości (tajnych) a w turze działań wydajemy rozkazy oddziałom i wchodzimy na jakieś terytoria. Np. ja, Austria piszę do Ciebie, Turcji, żebyśmy razem działając zabrali sobie, powiedzmy, Rumunię i Krym.

Skuteczność w tej grze polega na tym, żeby namówić innych do sojuszy, bo wtedy pojedyncza ofiara nie ma szans wobec tak dużej liczby oddziałów przeciwników. Jednak pod koniec gry, ważne jest, by w dogodnym momencie te sojusze zerwać. Najlepiej grający umieją w taki sposób zerwać sojusze, żeby nie zostawić po sobie złego wrażenia (przypomina się znany żart o tym, że dyplomata to taka osoba, która potrafi powiedzieć ***erdalaj w taki sposób, że czujesz ekscytację przed zbliżającą się podróżą). Podobno to raczej gracze początkujący często kłamią i łamią słowo. Tak przynajmniej opisuje to trzykrotny mistrz świata w tej grze, Andrew Goff, który pomógł trenować czatbota Cicero.

Czatbot Cicero został nauczony prawdomównego stylu grania nie tylko dlatego, że to jest styl najlepszych, „białkowych” grających. Stało się tak również z powodu obaw przed stworzeniem technologii, która natychmiast posłuży do robienia złych rzeczy. Wyobraźmy sobie czatbota, który znakomicie kłamie, negocjuje i nakłania ludzi do robienia rzeczy, których nie chcą. Świat przestępczy zrobiłby z tego użytek a firma Meta naraziłaby się na kłopoty.

Cicero nawet jeśli nie kłamie to nie znaczy, że od razu wszystko ujawnia. Swoje plany realizuje biorąc pod uwagę treść rozmów z innymi grającymi. W opisanych grach z ludźmi Cicero grał incognito, czyli grający nie wiedzieli, kto jest kim i czy grają z botem. Było to możliwe dzięki temu, że w grze wysyłano tylko schematyczne, rzeczowe i stosunkowo krótkie wiadomości.

Oznacza to, że nie mamy do czynienia ze sztuczną inteligencją, która jest w stanie udawać człowieka i negocjować tak, jak to robią ludzie – mieszając sprawy prywatne i oficjalne, nawiązując porozumienie poprzez wywołanie empatii! Co więcej, skoro przed grającymi ukrywano fakt, kto jest botem a kto człowiekiem, to wyniki tego eksperymentu nie są tak istotne, jak to opisywały niektóre media. A może wiedząc kto jest botem, ludzie ograliby bota, bo szybko dostrzegliby schematyczność jego gry? A może zaczęliby grać przeciw niemu?

Tu ciekawostka: czatbot Cicero potrafi udawać różne sposoby wypowiadania się. Ma wersję, w której pisze niechlujnie i bez znaków interpunkcyjnych, trochę jak nastolatek. Ma też wersje, piszące zupełnie inaczej. Nie mając świadomości, że rozmawiamy z czatbotem bardzo trudno byłoby się zorientować. Tak przynajmniej twierdzi inny z zawodowych graczy w Dyplomację, który również pracował w tym projekcie.

Nie przeprowadzono też prostego testu skuteczności negocjacyjnej Cicero: można było prosić grających, by przed napisaniem wiadomości deklarowali, jakie mają zamiary. Po wymianie wiadomości z czatbotem wiedzielibyśmy, czy zmienili zdanie pod wpływem skutecznych argumentów maszyny. Zamiast tego po prostu sprawdzono, w jak wielu grach Cicero wygrał a wygrywał na poziomie 10% najlepszych zawodników/zawodniczek.

Argumenty podaję za specjalistą, który omawia ten przypadek i studzi entuzjazm mediów. To prof. informatyki Jordan Boyd-Graber, który również zajmuje się grą Dyplomacja.


Boyd-Graber zwraca też uwagę, że Cicero nie grał zdradziecko. W „Dyplomacji” nie ma reguł, które zabraniają złamać danego słowa. Jeśli w turze rozmów umawiamy się z kimś na współpracę, to w turze działań możemy złamać słowo i zrobić coś zupełnie innego niż to, na co się umówiliśmy. Jeśli czatbot tego nie potrafi, to jednak brakuje mu ważnej umiejętności.

Podsumowując: Cicero to czatbot, który potencjalnie może stać się narzędziem wspomagającym ludzi w negocjacjach. Pamięta rozmowy, adaptuje się do warunków i umie osiągać cele w warunkach niepełnej wiedzy i chaosu. Nie jest w stanie zastąpić ludzi, ale ma potencjał do stania się asystentem negocjacji. W obszarze customer operations, czyli obsługi klienta tego rodzaju umiejętności również mogą być potrzebne choć nie jest dziś znane, jak zareagują ludzie na informację, że negocjują/rozmawiają z czatbotem.

W bardziej odległej przyszłości doskonalsze wersje czatbotów dyplomatycznych do pewnego stopnia mogą zautomatyzować negocjacje między krajami – tak piszą autorzy pewnego inspirującego tekstu na temat możliwego wpływu czatbotów na dyplomację. Wyobraźmy sobie automatycznych dyplomatów, którzy nieustannie pozostają ze sobą w kontakcie. To może sprzyjać obniżeniu napięć między krajami, zapewniając przepływ informacji w sytuacjach, w których do tej pory dochodziło do zrywania kontaktów. Oczywiście, jest też ryzyko związane z takim zastosowaniem technologii: dezinformacja, chaos informacyjny, przeładowanie informacjami.