Künstliche Intelligenz hat gerade einige der weltbesten Pokerspieler beherrscht

Carnegie Mellon Universität

Vier der weltbesten professionellen Pokerspieler wurden in einem epischen 20-Tage-Wettbewerb besiegt, mit einem künstliche Intelligenz (KI)-System einen großen Gewinn, nachdem er 120.000 Hände bei No-Limit Texas Hold'em dominiert hat.

Die KI namens Libratus führte die menschlichen Spieler bis zum Ende des Wettbewerbs um fast 1,8 Millionen US-Dollar an Chips an – ein starker Kontrast zu gerade vor zwei Jahren , als es einem anderen Programm nur gelang, einen technischen Gleichstand gegen vier menschliche Profis zu erzielen. Im Rückkampf 2017 hatten die Menschen überhaupt keine Chance.

Libratus wurde von Informatikern an der Carnegie Mellon University (CMU) entwickelt und tritt in die Fußstapfen früherer KIs, die den Menschen in Spielen wie z Googles DeepMind, dem einige der beeindruckendsten Go-Champions der Welt gehörten .

Aber das Erlernen von Poker ist ein differenzierteres, psychologischeres Gebiet – die Kunst zu beherrschen, den Gegner zu bluffen und gleichzeitig seine Hinweise zu lesen, zeigt, wie unglaublich ausgefeilt die KI Herausforderungen meistert, bei denen der Erfolg von mehr abhängt als nur der Beherrschung der Tischregeln.

„Der Computer kann beim Poker nicht gewinnen, wenn er nicht bluffen kann“ sagt CMU-Informatikleiter Frank Pfenning .

„Die Entwicklung einer KI, die dies erfolgreich tun kann, ist wissenschaftlich ein enormer Fortschritt und bietet zahlreiche Anwendungsmöglichkeiten.“ Stellen Sie sich vor, dass Ihr Smartphone eines Tages für Sie den besten Preis für ein neues Auto aushandeln kann. Das ist erst der Anfang.‘

Die Pokerstrategien von Libratus wurden auf der Grundlage von umgerechnet 15 Millionen Spielstunden verfeinert, bevor der Wettbewerb überhaupt begann. Die KI war auf einem Supercomputer mit 1,35 Petaflops und 274 Terabyte Speicher installiert.

Diese Spezifikationen bedeuten, dass der Supercomputer etwa 7.250-mal so schnell ist wie ein High-End-Notebook-PC und etwa 17.500-mal so viel Speicher hat.

Aber die Killerfunktion der KI bestand darin, von den menschlichen Profis zu lernen, während die Konkurrenz voranschritt, und ihre eigenen Strategien und Spielstile adaptiv zu verbessern, wann immer die anderen Spieler lernten, sie auszunutzen.

„Jeden Spieltag analysierte ein Meta-Algorithmus, welche Lücken die Profis in der Strategie von Libratus identifiziert und ausgenutzt hatten.“ sagt der leitende Forscher Tuomas Sandholm .

„Dann hat es die Lücken priorisiert und jede Nacht mithilfe des Supercomputers algorithmisch die drei besten gepatcht … Typischerweise entwickeln Forscher Algorithmen, die versuchen, die Schwächen des Gegners auszunutzen.“ Im Gegensatz dazu geht es hier bei der täglichen Verbesserung darum, Lücken in der eigenen Strategie algorithmisch zu schließen.“

Der Ansatz war erfolgreich – auch wenn er bei den menschlichen Konkurrenten, die während eines 20-tägigen Marathon-Wettbewerbs ihre eigene Taktik ständig anpassen mussten, zu einiger Verzweiflung führte.

„Der Bot wird jeden Tag besser und besser“ sagte einer der Profispieler, Jimmy Chou , mitten im Wettbewerb. „Es ist wie eine härtere Version von uns.“

Die Ansichten wurden von einem Mitkonkurrenten von Chou, Dong Kim, bestätigt.

„Ich habe bis heute nicht gemerkt, wie gut es war“, sagte er zu Cade Metz Verdrahtet am 10. Tag des Wettbewerbs.

„Ich hatte das Gefühl, als würde ich gegen jemanden spielen, der betrügt, als ob er meine Karten sehen könnte.“ Ich beschuldige es nicht des Betrugs. Es war einfach so gut.‘

Wie effektiv die Anpassungsfähigkeit von Libratus war, können Sie in der folgenden Grafik sehen:

Während die KI in den ersten fünf Wettkampftagen früh die Führung übernahm, waren am sechsten Tag alle Spieler ungefähr gleich an Chips.

Doch dann startete Libratus durch und legte in den nächsten neun Tagen deutlich um etwa 1 Million US-Dollar an Chips zu, während die menschlichen Spieler ständig an Boden verloren und nicht wieder aufholen konnten.

Nachdem der Wettbewerb nun vorbei ist, sagen die CMU-Forscher, dass sie die Geheimnisse der KI preisgeben werden, beginnend mit einer Präsentation bei der Association for the Treffen zur Förderung der künstlichen Intelligenz diesen Monat in San Francisco.

In den kommenden Monaten werden wissenschaftliche Arbeiten zur Erörterung der Programmierung erwartet.

Abseits der Welt der Kartenspiele mit hohen Einsätzen könnten die Entscheidungsfähigkeiten von Libratus laut dem Team letztendlich eine Rolle bei Geschäftsverhandlungen, Cybersicherheit und sogar bei medizinischen Behandlungen spielen.

Was die Spieler angeht, ist es kein Grund, sich für die Profis zu schämen, die trotz ihrer Niederlage jeweils einen Preispool von 200.000 US-Dollar für ihre Teilnahme am Wettbewerb erhalten.

Allerdings möchten sie wahrscheinlich nie wieder 20 Tage lang Poker gegen eine KI spielen müssen. Am letzten Wettkampftag wandte sich einer der Profis, Daniel McAulay, mit einer Frage an einen Zuschauer, die vielleicht nur ein halber Scherz war.

„Wie viel muss ich Ihnen bezahlen, um die letzten 50 Hände zu spielen?“ er hat gefragt . „Uhhhh, das ist so brutal.“

Über Uns

Die Veröffentlichung Unabhängiger, Nachgewiesener Fakten Von Berichten Über Gesundheit, Raum, Natur, Technologie Und Umwelt.