Was ist Rückwärtsinduktion?
Die Rückwärtsinduktion in der Spieltheorie ist ein iterativer Prozess, bei dem vom Ende eines Problems oder einer Situation an in der Zeit rückwärts argumentiert wird, um endliche ausgedehnte Formen und sequentielle Spiele zu lösen und eine Folge optimaler Aktionen abzuleiten.
Rückwärtsinduktion erklärt
Zur Lösung von Spielen wurde die Rückwärtsinduktion verwendet, seit John von Neumann und Oskar Morgenstern die Spieltheorie als akademisches Fach etablierten, als sie 1944 ihr Buch Theory of Games and Economic Behavior veröffentlichten.
In jeder Phase des Spiels bestimmt die Rückwärtsinduktion die optimale Strategie des Spielers, der den letzten Zug im Spiel macht. Dann wird die optimale Aktion des vorletzten Spielers bestimmt, wobei die Aktion des letzten Spielers als gegeben genommen wird. Dieser Vorgang wird solange rückwärts fortgesetzt, bis für jeden Zeitpunkt die beste Aktion ermittelt wurde. Tatsächlich bestimmt man das Nash-Gleichgewicht jedes Teilspiels des ursprünglichen Spiels.
Die aus der Rückwärtsinduktion abgeleiteten Ergebnisse lassen jedoch häufig ein tatsächliches menschliches Spiel nicht vorhersagen. Experimentelle Studien haben gezeigt, dass „rationales“ Verhalten (wie in der Spieltheorie vorhergesagt) im wirklichen Leben selten vorkommt. Irrationale Spieler können tatsächlich höhere Auszahlungen erzielen als durch Rückwärtsinduktion vorhergesagt, wie im Tausendfüßler-Spiel dargestellt.
Im Tausendfüßler-Spiel haben zwei Spieler abwechselnd die Möglichkeit, einen größeren Anteil eines zunehmenden Geldtopfs einzunehmen oder den Pot an den anderen Spieler weiterzugeben. Die Auszahlungen sind so angeordnet, dass man etwas weniger erhält, als wenn man den Pot in dieser Runde genommen hätte, wenn der Pot an den Gegner übergeben wird und der Gegner den Pot in der nächsten Runde nimmt. Das Spiel endet, sobald ein Spieler den Vorrat nimmt, wobei dieser Spieler den größeren Teil und der andere Spieler den kleineren Teil erhält.
Beispiel für die Rückwärtsinduktion
Nehmen wir zum Beispiel an, dass Spieler A zuerst geht und entscheiden muss, ob er den Stash "nehmen" oder "weitergeben" soll, der sich derzeit auf 2 US-Dollar beläuft. Wenn er nimmt, bekommen A und B jeweils 1 $, aber wenn A passt, muss Spieler B jetzt entscheiden, ob er spielt oder passt. Wenn B nimmt, bekommt er 3 $ (dh den vorherigen Einsatz von 2 $ + 1 $). und A bekommt $ 0. Aber wenn B passt, muss A jetzt entscheiden, ob er passt oder passt, und so weiter. Wenn beide Spieler immer passen, erhalten sie am Ende des Spiels jeweils eine Auszahlung von 100 US-Dollar.
Der Punkt des Spiels ist, wenn A und B zusammenarbeiten und bis zum Ende des Spiels weiterkommen, erhalten sie die maximale Auszahlung von jeweils 100 $. Aber wenn sie dem anderen Spieler misstrauen und erwarten, dass sie die erste Gelegenheit nutzen, sagt das Nash-Gleichgewicht voraus, dass die Spieler den niedrigstmöglichen Anspruch erheben werden (in diesem Fall 1 US-Dollar).
Das Nash-Gleichgewicht in diesem Spiel, in dem kein Spieler einen Anreiz hat, von seiner gewählten Strategie abzuweichen, nachdem er die Wahl eines Gegners in Betracht gezogen hat, legt nahe, dass der erste Spieler den Pot in der allerersten Runde des Spiels einnehmen würde. In der Realität tun dies jedoch relativ wenige Spieler. Infolgedessen erhalten sie eine höhere Auszahlung als die durch die Gleichgewichtsanalyse vorhergesagte Auszahlung.
Lösen von sequentiellen Spielen mit Rückwärtsinduktion
Unten ist ein einfaches sequentielles Spiel zwischen zwei Spielern. Die Bezeichnungen mit Spieler 1 und Spieler 2 sind die Informationssätze für Spieler 1 bzw. 2. Die Zahlen in den Klammern am unteren Rand des Baums sind die Auszahlungen an den jeweiligen Punkten. Das Spiel ist auch sequentiell, also trifft Spieler 1 die erste Entscheidung (links oder rechts) und Spieler 2 die Entscheidung nach Spieler 1 (oben oder unten).
Abbildung 1
Die Rückwärtsinduktion verwendet wie alle Spieltheorien die Annahmen von Rationalität und Maximierung, was bedeutet, dass Spieler 2 seine Auszahlung in jeder gegebenen Situation maximiert. Bei beiden Informationssätzen haben wir zwei Auswahlmöglichkeiten, insgesamt vier. Indem wir die Auswahlmöglichkeiten eliminieren, die Spieler 2 nicht auswählt, können wir unseren Baum eingrenzen. Auf diese Weise werden die Linien fett gedruckt, die die Auszahlung des Spielers am angegebenen Informationssatz maximieren.
Figur 2
Nach dieser Reduzierung kann Spieler 1 seine Auszahlungen maximieren, nachdem die Entscheidungen von Spieler 2 bekannt gegeben wurden. Das Ergebnis ist ein Gleichgewicht, das durch Rückwärtsinduktion von Spieler 1, der "rechts" wählt, und Spieler 2, der "hoch" wählt, gefunden wird. Nachfolgend finden Sie die Lösung für das Spiel, wobei der Gleichgewichtspfad fett gedruckt ist.
Figur 3
Zum Beispiel könnte man leicht ein Spiel wie das oben beschriebene mit Firmen als Spielern aufbauen. Dieses Spiel kann Produktversionsszenarien enthalten. Was könnte Unternehmen 2 als Reaktion darauf tun, wenn Unternehmen 1 ein Produkt veröffentlichen möchte? Wird Company 2 ein ähnliches Konkurrenzprodukt veröffentlichen? Indem wir den Umsatz dieses neuen Produkts in verschiedenen Szenarien prognostizieren, können wir ein Spiel einrichten, um vorherzusagen, wie sich Ereignisse entwickeln könnten. Unten sehen Sie ein Beispiel, wie man ein solches Spiel modellieren könnte.
Figur 4