Entscheidungs- und Spieltheorie

Die Ringvorlesung Methoden der quantitativen Sozialforschung geht in die zweite Runde des Jahres 2013. Diesmal gibt uns Thomas Voss von der Leipziger Soziologie eine kleine Einführung in die beiden Themen Modellbildung und Entscheidungs- und Spieltheorie. Ausgangspunkt des Themas ist das Problem, in den Sozialwissenschaften, Ableitungen aus Thesen zu erstellen. Diesem Problem kann mit Hilfe der Theoriebildung begegnet werden. Notwendig zum Aufstellen von Modellen ist eine formalisierte Darstellung mit idealisierten (“unrealistischen”) Annahmen, bei der bestimmte externe Faktoren ausgespart werden. Zum Beispiel wird bei den bekannten Fallgesetzen die Reibung vernachlässigt.

Entscheidungstheorie

Mittels der Entscheidungstheorie wird eine Theorie des rationalen Handelns aufgestellt. Rational heißt in diesem Fall, dass Handlungen zielgerichtet basierend auf bestimmten subjektiven und situationsabhängigen Konsistenzkriterien erfolgen. Dabei lassen sich drei grundlegende Arten von Situationen unterscheiden, von denen insbesondere Entscheidungen mit Risiko/Unsicherheit und interaktive Entscheidungen für die Sozialwissenschaften von Interesse sind.

  1. Entscheidungen unter Sicherheit: Hier sind die Konsequenzen von Handlungen vollständig bekannt.
  2. Entscheidungen mit Risiko/Unsicherheit: Die Konsequenzen von Handlungen werden mit gewissen Wahrscheinlichkeiten erwartet.
  3. Interaktive Entscheidungen: Hierbei sind die Konsequenzen von Handlungen von anderen abhängig (Spieltheorie).

Die Entscheidungstheorie ist im Kern normativ, da sie nach sinnvollen Kriterien rationaler Entscheidungen sucht, indem sie hypothetische Imperative, d.h. wenn ich A will sollte ich B tun, formuliert. Die Frage nach der empirischen Anwendbarkeit einer normativen Theorie beantwortet Weber damit, dass das faktische Handeln an Rationalitätskriterien gemessen werden soll. Weitere Anwendungsbereiche einer normativen Rationalitätstheorie sind u.a. die Klärung von Begrifflichkeiten, Erklärung und Vorhersage sowie das Aufstellen von Handlungsempfehlungen.

Klassische Theorie des erwarteten Nutzens

In der klassischen Theorie des erwarteten Nutzens wird von der Annahme ausgegangen, dass Menschen sich für die Handlungsmöglichkeit mit dem höchsten Erwartungswert entscheiden. Der Ausgangspunkt ist dabei eine Entscheidungssituation, in der die Konsequenzen von Handlungen nicht bekannt sind. Diese Unsicherheiten werden mittels Wahrscheinlichkeiten dargestellt und verschiedene Handlungsalternativen lassen sich in sogenannte Lotterien darstellen.

Gegeben sei also eine Menge sicherer Ausgänge (Optionen) X = {A1, …, Ak}. Eine Wahrscheinlichkeitsverteilung über X heißt Lotterie L = (A1,p1; …; Ak,pk) mit pi≥0 und ∑(pi)=1. Ein Beispiel für eine Lotterie ist C = (100, 0.7; 0, 0.3), d.h. mit einer Wahrscheinlichkeit von 0.7 wird ein Gewinn von 100 und mit einer Wahrscheinlichkeit von 0.3 ein Gewinn von 0 erwartet. Der Erwartungswert einer Lotterie ist dementsprechend E(L) = ∑(Ai*pi). Im Beispiel ist also E(C) = 100*0.7 + 0*0.3 = 70.

Probleme der klassischen Theorie

Entsprechend der Annahme, dass sich Menschen für die Lotterie mit dem höchsten Erwartungswert entscheiden, ist weiterhin anzunehmen, dass Lotterien mit gleichem Erwartungswert als gleichwertig angesehen werden. Dass diese Annahme falsch ist konnte aber z.B. von Bernoulli im Rahmen des St-Petersburg-Paradoxon gezeigt werden. Dabei wird der Erwartungswert einer Lotterie unendlich, wodurch eine unendlich hohe Auszahlung erwartet wird. Dementsprechend sollte es rational sein, unendlich viel Geld auf die Auszahlung zu setzen. Dies wird in der Realität allerdings niemals passieren, wodurch sich das Problem ergibt, dass der gleiche Erwartungswert nicht immer gleich präferiert wird.

Stattdessen beinhalten Präferenzen auch die Risikoneigung der Akteure; der Nutzen ist also ungleich zu einem objektiven Wert. Aus diesem Grund kann der einfache Erwartungswert nicht mehr als rationale Handlungsgrundlage dienen und es ist notwendig, eine Nutzenfunktion zu bilden, die die Risikoneigung der Akteure beachtet. Dies lässt sich an einem weiteren Beispiel zweier Lotterien verdeutlichen. Die Lotterien L1=(1Mio, 1.0) und L2 = (10Mio, 0.1; 0, 0.9) haben beide einen Erwartungswert von 1Mio und werden damit als gleich betrachtet. Wirt stattdessen eine Nutzenfunktion u(x) = √x verwendet, verändern sich die Lotterien wie folgt: L1 = (√1Mio, 1.0), L2 = (√10Mio, 0.1; √0, 0.9). L1 hat also einen Erwartungswert von 1000, der Erwartungswert von L2 sinkt hingegen auf etwa 316.

Weiterentwicklung und Grenzen der Theorie

John von Neumann hat die Konzepte der Nutzentheorie durch die Formulierung von Axiomen weiterentwickelt. Die Axiome, die als empirische Annahmen über die Präferenzen von Menschen zu betrachten sind, sind dabei Transitivität, vollständige Vergleichbarkeit, das Archimedes-Axiom und Unabhängigkeit. Schon bei der vollständigen Vergleichbarkeit zeigt sich, dass dies nur idealisierte Vorstellungen über das Verhalten von Menschen sein können, da sich z.B. in der Realität die Frage nach der Vergleichbarkeit verschiedener moralischer Werte stellt. Trotzdem lässt sich mit Hilfe der axiomatisierten Theorie der Nutzen messen.

An Grenzen stößt die Nutzentheorie allerdings beim sogenannten Allais-Paradoxon, da sich gewisse Präferenzen nicht abbilden lassen. Beispielsweise haben Menschen eine unterschiedliche Risikoneigung je nachdem, ob sie sich zwischen zwei unsicheren Alternativen oder einer sicheren und einer unsicheren Alternative entscheiden müssen. Während sich im ersten Fall die Mehrzahl der Menschen eher risikofreudig verhält, ist dies im zweiten Fall andersherum und die Mehrzahl verhält sich eher risikoavers. Um dies im Rahmen einer Theorie abzubilden, haben u.a. Kahnemann und Tversky die Prospect-Theory entwickelt, in deren Rahmen Gewinne risikoscheu und Verluste risikofreudig bewertet werden. Die Wertnutzenlehre ist also empirisch widerlegt. Allerdings findet sie in der wissenschaftlichen Praxis trotzdem weiterhin Anwendung, da bisher keine besseren Alternativen existieren, die sich z.B. auch in der Spieltheorie anwenden lassen.

Spieltheorie

Die Ausgangssituation der Spieltheorie ist eine Situation strategischer Interdependenz, d.h. die Konsequenzen der Handlungen einer Person hängen von den Handlungen anderer Personen ab. Ein Spiel besteht in diesem Sinne aus einem Tripel S = (Akteure, Handlungsmöglichkeiten, Konsequenzen dargestellt als Nutzenfunktion). Ein bekanntes Beispiel eines solchen Spiels ist das Gefangenendilemma. Mit Hilfe des Gefangenendilemmas kann gezeigt werden, dass eine individuell rationale Entscheidung (dominante Strategie: beide gestehen) zu einem schlechteren Gesamtergebnis führt (ein besseres würde erreicht werden, wenn beide schweigen).

Eine Spielart, in der keine dominante Strategie existiert, ist z.B. die Hirschjagd von Rousseau. Bei der Hirschjagd gehen zwei Jäger auf die Pirsch. Wenn beide auf Hirschjagd gehen, erlegen sie mit Sicherheit einen Hirsch (entspricht einem Gewinn von 2). Ein Jäger, der auf Hasenjagd geht, erlegt sicher einen Hasen (entspricht einem Gewinn von 1). Allerdings hat ein Jäger, der alleine auf Hirschjagd geht (d.h. der andere geht auf Hasenjagd), keine Chance den Hirsch zu erlegen (entspricht einem Gewinn von 0). Hier gibt es keine dominante Strategie, da die beste Antwort eines Spielers von der besten Antwort des anderen Spielers abhängt – dies lässt sich mit Hilfe eines Nash-Gleichgewichts darstellen. Dabei wählt jeder der Spiele die Antwort auf den anderen, wodurch keine Motivation für einseitige Abweichungen entsteht.

Die Suche nach rationalen Handlungsmöglichkeiten in der Spieltheorie wird weiter dadurch verkompliziert, dass Strategien teilweise nicht glaubwürdig sind. Ein Beispiel hierfür ist das Ultimatumspiel, bei dem ein Nash-Gleichgewicht auf einer unglaubwürdigen Drohung beruht. In einer Version des Ultimatumspiels wird Gefangenem 1 Essen angeboten. Von diesem Kuchen muss er eine bestimmte Menge an den zweiten Gefangenen abgeben. Empfindet der zweite Gefangene die ihm angebotene Menge als zu gering, kann er diese ablehnen. In diesem Fall erhält allerdings auch der erste Gefangene nichts, so dass beide verhungern.

Dementsprechend wäre es für den zweiten Gefangenen selbst bei ungerechter Behandlung rational, den angebotenen Teil anzunehmen. Seine Drohung, das Essen abzulehnen, ist also unglaubwürdig. Allerdings hat sich in Experimenten gezeigt, dass diese rationale Entscheidung in der Regel nicht getroffen wird. Ein aktuelles Beispiel für die Frage nach der Glaubwürdigkeit einer Drohung ist die Drohung der CSU, die Koalition platzen zu lassen, wenn es keine PKW-Maut gibt.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.