AlphaGo’s Erfolg und Auswirkungen auf die Rechtsbranche

„Google schlägt Mensch“, „Künstliche Intelligenz schlägt Mensch“ und „Mensch verliert gegen Maschine“. Das waren einige der Schlagzeilen, nachdem Googles AlphaGo am 15. März 2016 den amtierenden Weltmeister Lee Se-dol im Brettspiel „Go“ besiegt hatte.

Die Reaktionen und das Interesse an diesem Sieg zeigen, dass AlphaGos Erfolg eine Grundfaszination und -angst von Menschen widerspiegelt: Die Angst von Maschinen bzw. Robotern irgendwann überflügelt und ersetzt zu werden. Auch beim Sieg von IBMs „Deep Blue“ gegen den Schachgroßmeister Garry Kasparow im Jahr 1997 waren die Reaktionen ähnlich emotional. In einer „intellektuellen“ Domäne waren Menschen Computern auf einmal unterlegen. Nicht wenige Schachspieler gerieten in eine gewisse Sinnkrise.

Seitdem sind Computer nicht mehr aufzuhalten. Wenige Jahre nach dem Sieg von “Deep Blue” wurden Gesellschaftsspiele wie Dame, Backgammon oder Scrabble von Computerprogrammen dominiert. Ein weiterer Meilenstein war der Sieg von IBM’s Watson im Spiel „Jeopardy“ im Jahr 2011. Die Herausforderung bei Jeopardy ist, Fragen, die in Umgangssprache und bewusst mehrdeutig formuliert werden, innerhalb eines Zeitlimits von nur fünf Sekunden zu beantworten. IBM’s Watson schlug in einem viel beachteten und zitierten Spiel die besten menschlichen Jeopardy-Spieler deutlich.

Während man sich mit einer Unterlegenheit menschlicher Spieler in den genannten Spielen bereits in gewisser Weise abgefunden hatte, blieb ein Spiel für Computer bislang unerreichbar: Das Brettspiel „Go“.

Go – das komplexeste Spiel der Welt

Go ist ein uraltes Strategiespiel, das vornehmlich in Asien gespielt wird. Man spielt mit linsenförmigen schwarzen und weißen Steinen, die auf das Spielfeld gesetzt werden. Ziel des Spiels ist es, mit den Steinen der eigenen Farbe möglichst große Gebiete zu umranden.

By Donarreiskoffer – Self-photographed, CC BY-SA 3.0, Wikimedia

Die Besonderheit des Go-Spiels ist seine extrem hohe Komplexität, obwohl die Spielregeln im Grunde sehr einfach sind. Diese hohe Komplexität macht Go für Forscher so interessant. Demis Haassabis, der Gründer von DeepMind, der Firma, die AlphaGo entwickelte, drückt es wie folgt aus: „Go is considered to be the pinnacle of game AI research. It’s been the grand challenge, or Holy Grail if you like, of AI since Deep Blue beat Kasparov at chess. Go is a very beautiful game with extremely simple rules that lead to profound complexity. In fact, Go is probably the most complex game ever devised by humans.” Edward Lasker, ein berühmter Schach- und Go-Spieler, formulierte etwas poetischer: „While the baroque rules of chess could only have been created by humans, the rules of Go are so elegant, organic, and rigorously logical that if intelligent life forms exist elsewhere in the universe, they almost certainly play Go.”

Aufgrund seiner Komplexität war Go für Computer bislang nicht zu “knacken”. Go-Profis gewannen ohne Mühe gegen jeden Computer. Noch im Jahr 2006 titelte die englische Zeitung The Guardian daher: „Computers just can’t seem to get past Go”. Die bislang gültige Lehrmeinung war, dass Maschinen noch mindestens 10 Jahre brauchen werden, um einen professionellen Go-Player schlagen zu können. Einige hielten die maschinelle Beherrschung des Go-Spiels sogar für unmöglich.

Folgende Zahlen verdeutlichen, warum Go so viel komplexer als beispielsweise Schach ist. Während es bei einem Schachspiel ungefähr 35 mögliche Züge pro Figur gibt, sind es bei Go 250. Ein Schachspiel hat maximal 80 Züge, ein Go-Spiel 150. Aufgrund der exponentiell wachsenden Zugmöglichkeiten übersteigt die Möglichkeit aller erdenklichen Züge bei einem Go-Spiel (10761) die Anzahl aller Atome im Universum (1080) bei weitem. Eine unvorstellbar große Anzahl, die unsere Vorstellungskraft übersteigt. So sehen mögliche Zugmöglichkeiten bei Go visualisiert aus:

Go search tree

Aufgrund dieser schier unendlichen Anzahl an Zügen zeichnen sich professionelle Go-Spieler dadurch aus, dass sie – oft erst nach jahrzehntelangem Üben – eine Art Intuition/Gefühl für das beste Muster auf dem Brett entwickeln. Während ein Schachspieler eher rational/logisch die einzelnen denkbaren Züge möglichst weitgehend durchdenkt und in die Zukunft hinein analysiert, versucht ein Go-Spieler Verhältnisse und Zusammenhänge zwischen den Steinen zu erkennen. Go-Spieler umbeschreiben ihre Züge häufig in eher vagen Situationsbeschreibung („leichte“ oder „schweren“ Position der Steine) oder sprechen von „latenten Möglichkeiten“ eines bestimmten Musters. Werden Go-Spieler befragt, wissen sie häufig selbst nicht genau, warum sie einen bestimmten Zug für vorteilhaft hielten oder sich für eine Spielstrategie entschieden. Die Züge entspringen – eher unterbewusst – einer erfahrungsgestützten Intuition.

Aufgrund der oben beschriebenen Komplexität von Go ist es schlicht unmöglich, alle erdenklichen Suchbäume, die in der Grafik dargestellt sind, durchzuprüfen, um den besten Zug zu finden. Aus diesem Grund ist Go nicht allein mit reiner Computerleistung („brute force“) beizukommen. Die Forscher, die AlphaGo entwickelt haben, mussten daher nach einer anderen Methode vorgehen.

Wie AlphaGo die Komplexität von Go meistert

Um die Komplexität des Go-Spiels beherrschbar zu machen, haben die Entwickler von AlphaGo einen klassischen Suchbaum (tree search) mit zwei neuronalen Netzwerken (ein Value und ein Policy Netzwerk) kombiniert, die wiederum aus vielen Millionen „Layern“ aus neuronenähnlichen Verbindungen bestehen (siehe hierzu ausführlich und zu den komplexen Einzelheiten, die hier nur vereinfacht wiedergeben werden können, den von den Machern von AlphaGo geschriebenen Artikel in Nature):

Ein „Value Netzwerk“ schätzt, wie wahrscheinlich ein bestimmter Spielstand zum Sieg führt. Wie wahrscheinlich ist es, dass der Spieler mit den schwarzen Steinen gewinnt, wenn man den derzeitigen Spielstand betrachtet? Im Gegensatz zu reinen „brute force“-Methoden werden die Suchbäume allerdings nicht bis zum Ende durchsucht. Ein „Policy Netzwerk“ bestimmt, welcher nächste Zuge eine höhere Chance hat, zu einem Sieg zu führen. Auch hier werden wiederum nicht alle erdenklichen Möglichkeiten in Betracht gezogen, sondern lediglich eine überschaubare Anzahl. Durch dieses Vorgehen wird die Anzahl der zu untersuchenden Spielvariablen dramatisch reduziert.

Das „Policy Network“ wurde mit ca. 30 Millionen Go-Positionen aus historischen Spielen „gefüttert“. Danach verbesserte es sein Spiel, in dem es millionenfach gegen sich selbst spielte. Hierin liegt eine Besonderheit von AlphaGo: Es hat die Fähigkeit sich im Wege eines Trial-and-Error-Prozesses (reinforcement learning) „selbst“ zu trainieren. AlphaGo initiiert Spiele gegen sich selbst und lernt aus diesen. Diese Technik ist auch als Monte-Carlo-Suchbaum bekannt. Die Besonderheit bei AlphaGo ist, dass der Monte-Carlo-Suchbaum durch das neurale Netzwerk gesteuert wird. Durch diese Möglichkeit des „Selbsttrainings“ verbessern sich die Fähigkeiten von AlphaGo stetig und exponentiell. Bei ersten Tests im Herbst 2015 gewann AlphaGo nur knapp gegen den Go-Europameister Fan Hui. Lee Se-dol, der amtierende Go-Weltmeister, der letztendlich gegen AlphaGo verlor, war sich deswegen seines Sieges sicher. Der Go-Weltmeister ist um Klassen besser als der Go-Europameister. Aufgrund des Selbsttrainings hatte sich AlphaGo aber schon so stark verbessert, dass auch Lee Se-dol keine Chance mehr hatte. Es gibt nur einen Spieler namens Ke Jie, der derzeit noch eine höhere Elo-Zahl als AlphaGo hat, also zumindest theoretisch besser als AlphaGo spielen sollte.

Durch das neuronale Netzwerk hat AlphaGo so etwas wie Intuition erhalten. Wie ein menschlicher Go-Spieler erahnt der Computer die besten Züge (Policy Network) und kann seine starke Computerleistung ausspielen. Diese computergestützte (d.h. nicht wie beim Menschen erzeugte) „Intuition“ ist das eigentlich Besondere an AlphaGo (richtig ist, dass die Intuition nur für einen kleinen Anwendungsbereich erfolgreich getestet wurde. Die menschliche Intuition ist viel umfassender). Die Intuition ermöglicht es AlphaGo Spielzüge zu erahnen, ohne dass sie bis in letzte rein mathematisch durchdacht worden wären. Hinzu kommt, dass die Technik hinter AlphaGo – anders als z.B. Deep Blue oder IBM Watson – kein vordefiniertes Anwendungsgebiet hat und deshalb auf die unterschiedlichsten Gebiete anwendbar ist. AlphaGo ist kein „Expertensystem“ mit spezifischen Regeln, sondern ein Lernsystem, das durch Beobachten und Üben Regeln lernt. Die Technik hinter AlphaGo lernt aus Erfahrung, ganz ähnlich wie ein Mensch.

Zusammenfassend ist somit die Besonderheit von AlphaGo, dass es etwas wie Intuition bzw. Phantasie entwickeln bzw. imitieren kann. Es ist in der Lage, mit den unterschiedlichsten Aufgaben- und Anwendungsgebieten umzugehen. Zudem kann AlphaGo, selbst im Wege eines Trial-and-Error-Prozesses lernen, ohne dass es eines menschlichen Inputs bedarf. Zu Recht wird dies als Meilenstein in der Geschichte der Entwicklung künstlicher Intelligenz gefeiert.

Was heißt das für die Rechtsbranche?

Was bedeuten die geschilderten Entwicklungen rund um AlphaGo für die Rechtsbranche? Warum hat die Entwicklung eines Programms, das ein komplexes Spiel, aber eben kein juristisches Problem, löst, Auswirkungen auf juristische Berufe? Ich denke, dass der für viele überraschende Erfolg von AlphaGo zumindest dreierlei aufzeigt:

1. Der technische Entwicklungsfortschritt wird grundsätzlich unterschätzt. Selbst viele Fachleute gingen davon aus, dass noch Jahre, wenn nicht Jahrzehnte vergehen, bevor Computer in der Lage sind, menschliche Go-Spieler schlagen zu können. Sie lagen falsch. Einem erst 5 Jahre alten Unternehmen gelangen unglaublich schnelle Fortschritte. Es kann daher gefährlich sein, die Schnelligkeit technischer Entwicklung zu unterschätzen. Daniel und Richard Susskind sprechen in ihrem Buch „The Future of the Legal Profession“ in diesem Zusammenhang von einer „technological myopia“, um zu verdeutlichen, dass Menschen intuitiv exponentielles Wachstum missverstehen. Wir sind es gewohnt, in linearen Wachstumsschüben zu denken. Die technologische Entwicklung ist aber in vielen Bereichen exponentiell, wie folgendes Video erklärt:

Ein Beispiel zur Verdeutlichung: Wenn ein Computer im Jahr 2001 einen Speicher von 1 GB und im Jahr 2010 einen von 512 GB hat, würde man vermuten, dass der Speicherplatz im Jahr 2020 bei ca. 1000 GB liegen würde. Das ist falsch. Tatsächlich wäre die Speicherkapazität, wenn man ein exponentielles Wachstum annimmt 524.288 GB. Im Jahr 2030 wäre die Speicherkapazität ca. 1 Milliarde GB.

2. Die Entwicklung von künstlicher Intelligenz funktioniert schneller und besser als gedacht. Dies hängt auch damit zusammen, dass immer mehr Geld in die Erforschung künstlicher Intelligenz investiert wird. Im Jahr 2015 waren es allein $ 8,5 Milliarden. Viermal so viel wie noch 2010. Internetgrößen wie Baidu, Facebook, Google und Microsoft investieren solchermaßen große Summen. An vielen Forschungseinrichtungen und Universitäten nimmt die Forschung stetig zu. Startups, die sich mit künstlicher Intelligenz beschäftigten, sprießen wie Pilze aus dem Boden. Die Programme und Tools, die derzeit entwickelt werden, können auch auf juristische Sachverhalte angewendet werden. Je besser die eingesetzten Tools werden, umso besser und vielversprechender werden auch die Ergebnisse sein. Dies kann für die Rechtsbranche eine bessere und schnellere Entwicklung von Programmen bedeuten, die erfolgreich künstliche Intelligenz im Rechtsbereich einsetzen.

3. Künstliche Intelligenz kann Intuition und Erfahrung imitieren. An der Entwicklung von AlphaGo ist zudem bemerkenswert, dass Computer in einem Bereich erfolgreich sind, der nicht nur auf reiner Logik basiert. AlphaGo schafft es, (eine gewisse Form von) Intuition durch einen selbstlernenden Prozess zu entwickeln, die der Intuition von Menschen (in diesem Bereich) überlegen ist. Bereiche wie Phantasie und Intuition wurden bisher als „immun“ für künstliche Intelligenz angesehen. AlphaGo zeigt nun, dass man sich hier zumindest nicht allzu sicher sein sollte. Auf dem Hintergrund der Punkte 1 und 2 werden Computer bei diesen Fähigkeiten exponentiell schnell besser werden. Da juristische Beratung auch mit Erfahrung und Intuition einhergeht, wird es spannend zu beobachten sein, wie sich diese Entwicklung auf die Rechtsbranche auswirken wird.

Der Artikel gibt ausschließlich die private Meinung des Autors wider.