Bij een prisoners dilemma ontstaat een Nash-evenwicht dat niet optimaal is.
Eenzijdig handelen kan de uitkomst niet verbeteren, maar door bijvoorbeeld samenwerking zou een betere uitkomst tot stand kunnen komen.
Het klassieke voorbeeld van het gevangenenprobleem
Situatie:
- Eduard de Roos is vermoord
- twee verdachten: Theo G. en Mohammed V.
- bij aanhouding droegen zij een wapen, zonder wapenvergunning
- één van de verdachten is vermoedelijk de dader
- er is genoeg bewijs voor 2 jaar cel voor verboden wapenbezit
- bekentenis is nodig om de moord op te lossen
Werkwijze politie:
- verdachten worden apart verhoord (er is dus géén overleg mogelijk tussen de verdachten)
- voorgelegde keuze: zwijgen of de ander aangeven
- als beiden zwijgen moeten beiden 2 jaar de gevangenis in voor verboden wapenbezit
- als je als enige de ander aangeeft ga je vrijuit en krijgt de ander 14 jaar cel
- als ze beiden de ander aangeven, moeten beiden 10 jaar de cel in (omdat niet bewezen kan worden wie er geschoten heeft)
Deze hele situatie kunnen we in een opbrengstenmatrix zetten:
jaren cel | Mohammed V. | ||
zwijgen | ander aangeven | ||
Theo G. |
zwijgen | 2 jaar , 2 jaar | 14 jaar , vrij |
ander aangeven | vrij , 14 jaar | 10 jaar , 10 jaar |
De overwegingen van Mohammed V.:
- wanneer Theo zwijgt, kan ik hem het beste aangeven: vrij is beter dan 2 jaar de cel in
- wanneer Theo me aan geeft, kan ik hem het beste óók aangeven: 10 jaar cel is beter dan 14 jaar cel
De overwegingen van Theo G.:
- wanneer Mohammed zwijgt, kan ik hem het beste aangeven: vrij is beter dan 2 jaar cel
- wanneer Mohammed me aan geeft, kan ik hem het beste óók aangeven: 10 jaar cel is beter dan 14 jaar cel
Wanneer we dat verwerken in de opbrengstenmatrix, kunnen we het Nash-evenwicht vinden:
jaren cel | Mohammed V. | ||
zwijgen | ander aangeven | ||
Theo G. |
zwijgen | 2 jaar , 2 jaar | 14 jaar , vrij |
ander aangeven | vrij , 14 jaar | 10 jaar , 10 jaar |
Hierdoor is het Nash-evenwicht alles behalve optimaal: ze gaan allebei 10 jaar de cel in.
Veel beter was het geweest als ze allebei gezwegen hadden. Dan was de gezamenlijke opbrengst veel beter. Dit niet-optimale Nash-evenwicht is hét kenmerk van een prisoners dilemma.
Een economisch prisoners dilemma
Twee kledingzaken in een winkelcentrum moeten beslissen of zij wél of niet vervroegde uitverkoop gaan houden.
De keuzes en opbrengsten staan in onderstaande opbrengstenmatrix.
winst in euro’s | Shoeby | ||
geen uitverkoop | wel uitverkoop |
||
H&M |
geen uitverkoop | 5.000 , 5.000 | 2.000 , 7.000 |
wel uitverkoop | 7.000 , 2.000 | 4.000 , 4.000 |
De overwegingen Shoeby:
- wanneer H&M geen uitverkoop houdt, kan ik het beste wél een uitverkoop houden: €7.000 is beter dan €5.000
- wanneer H&M wél uitverkoop houdt, kan ik het beste óók uitverkoop houden: €4.000 is beter dan €2.000
De overwegingen van H&M:
- wanneer Shoeby geen uitverkoop houdt, kan ik het beste wél een uitverkoop houden: €7.000 is beter dan €5.000
- wanneer Shoeby wél uitverkoop houdt, kan ik het beste óók uitverkoop houden: €4.000 is beter dan €2.000
Wanneer we dat verwerken in de opbrengstenmatrix, kunnen we het Nash-evenwicht vinden:
winst in euro’s | Shoeby | ||
geen uitverkoop | wel uitverkoop |
||
H&M |
geen uitverkoop | 5.000 , 5.000 | 2.000 , 7.000 |
wel uitverkoop | 7.000 , 2.000 | 4.000 , 4.000 |
Oplossingen
Om tot een optimale uitkomst te komen moeten beide partijen samenwerken. Vertrouwen en geloofwaardigheid zijn dan natuurlijk belangrijk om er zeker van te zijn dat de ander zich houdt aan de afspraken.
Zoiets kan door het opstellen van contracten, maar dat mag niet altijd. Bijvoorbeeld door geldende kartelwetgeving, die verbiedt dat bedrijven prijsafspraken maken.
Een andere manier om een prisoners dilemma te doorbreken is dat de overheid ingrijpt. Dat zal in bovenstaand voorbeeld niet gebeuren, maar er zijn andere situaties denkbaar waar de maatschappij er belang bij heeft dat er geen prisoners dilemma ontstaat.