Dilema vězeňe
dilema vězeňe je příklad non-nula-součet hra to demonstruje konflikt mezi rozumným individuálním chováním a výhody spolupráce v jistých situacích.
| Tabulka s obsahem |
| 1 krátký obrys 2 opakovaný vězeň je dilema 3 varianty 4 přítel nebo nepřítel 5 odkazů 6 vidět také 7 vnějšího spojení |
Klasické vězeňské dilema je takto:
- Dva podezřívá být zatčený policií. Policie má nedostatečný důkaz pro přesvědčení, a mít oddělil je, navštívit každého je a nabídnout stejnou dohodu: Jestliže vy přiznáte a vaše accomplice zůstane tichý, on dostane plný 10-věta roku a vy jdete volný. Jestliže vy oba zůstanou tiší, všichni my můžeme dělat je dát vám obou 6 měsíců pro menší poplatek. Jestliže vy oba vyznají se, vy každý dostat 5 roků.
- Každý vězeň individuálně důvody jako toto: Jeden moje accomplice přiznal nebo on dělal ne. Jestliže on dělal a já zůstanu tichý, já dostanu 10 roků, zatímco jestliže já vyznám se, že já jen dostanu 5. Jestliže on zůstal tichý, pak tím, že vyzná se, že já jdu volný, zatímco tím, že zůstane tichý já dostanu 6 měsíců. V jakémkoliv případě, to je lepší pro mě jestliže já přiznám. Od každého je důvody stejný cesta, oba vyznají se, a dostat 5 roků. Ale ačkoli každý znamenal, že co vypadalo, že je rozumný argument dosáhnout nejlepšího výsledku, jestliže oni měli místo toho oba zůstali tiší, oni by jen měli sloužil 6 měsíců.
V politická věda, dilema vězeňe je často používáno objasnit problém dvou států dostat se do závod v zbrojení. Oba budou vyvozovat, že oni mají dvě možnosti, jeden zvýšit vojenské výlohy nebo udělat dohodu redukovat zbraně. Žádný stát může být jistý, že ten jiný bude držet se takový dohoda; proto, oni oba sklon k vojenské expanzi. ironie je to oba státy vypadají, že jedná rozumně, ale výsledek je kompletně nerozumný.
V jeho knize Evoluce spolupráce (1984), Robert Axelrod prozkoumal rozšíření k klasický PD scénář, který on volal " opakoval dilema vězeňe. " v tomto, účastníci musí vybrat si jejich vzájemnou strategii znovu a znovu, a mít paměť jejich předchozích setkání. Příklad, který on používal byl dva lidé setkávat se a měnit zavřená zavazadla, s pochopením, že jeden z nich obsahuje peníze, a jiný obsahuje položku být koupen. Jeden hráč může rozhodnout se ctít obchod tím, že dá do jeho tašky co on souhlasil nebo on může přeběhnout tím, že vydá prázdný pytel. Toto odráží dilema vězeňe: pro každého účastníka individuálně, to je lepší k defektu, ačkoli oba by byli lepší pryč jestliže oba spolupracovali.
Axelrod objevil, že když tato setkání byla opakována přes dlouhé časové období se mnoho hráči, každý s různými strategiemi, " chamtivý " strategie inklinovaly dělat velmi uboze z dlouhodobého hlediska zatímco více " altruistický " strategie dělaly lépe, jak soudil čistě sobeckostí. On používal toto ukazovat možný mechanismus vysvětlovat, že co předtím bylo těžká díra v Darwinian teorie: jak může zřejmě altruistické chování se vyvíjet z čistě sobeckých mechanismů přirozený výběr?
Nejlepší deterministická strategie se nalézala být "Půjčka za oplátku", který Anatol Rapoport se vyvinul a přihlásil se do soutěže o nejlepší strategii, která mohla být psána jak algoritmu počítače. To bylo jak jednoduchý jak některý vstoupil, a zvítězil v soutěži. Strategie je jednoduše spolupracovat v první iteraci hry; po tom, dělat co váš oponent dělal na předchozím pohybu. Mírně lepší strategie je " půjčka za oplátku se shovívavostí ". Když váš oponent přeběhne, na příštím pohybu vy někdy spolupracujete stejně s malou pravděpodobností (kolem 1 % - 5 %). Toto počítá s příležitostným zotavením od být chycen v cyklu zběhnutí. Přesná pravděpodobnost závisí na lineup oponentů. " půjčka za oplátku se shovívavostí " je nejlepší když miscommunication je představen ke hře. To znamená, že někdy váš pohyb je nesprávně reportoval vašemu oponentovi: vy spolupracujete, ale váš oponent slyší, že vy jste přeběhli.
Pro opakované vězeňské dilema, to není vždycky správné říkat, že nějaká daná strategie je nejlepší. Pro příklad, zvažovat populaci kde každý přeběhne každý čas, kromě pro jediného jednotlivce po sýkorce-pro-strategie tretky. Ten jednotlivec je u drobné nevýhody protože ztráty na prvním otočení. V takový populace, optimální strategie pro toho jednotlivce má přeběhnout každý čas. V populaci s jistým procentem vždy-odpadlíci a bytí odpočinku sýkorka-pro-hráči tretky, optimální strategie pro jednotlivce závisí na procentu, a na délce hry. Simulace populací byly dělány, kde jednotlivci s nízkými skóre umřou pryč, a ti s vysokými skóre množit. Směs algoritmů v populaci finále obecně závisí na směsi v počáteční populaci.
Jestliže opakované vězeňské dilema bude být opakováno přesně N časy, pro nějakou známou konstantu N, pak je další zajímavý fakt. Nash rovnováha je k defektu každý čas. To je snadno dokázané přerušením. Vy byste mohli také defekt na posledním otočení, protože váš oponent nebude mít možnost potrestat vás. Proto, vy oba přeběhnou na posledním otočení. Pak, vy byste mohli také defekt na sekundě-k-naposledy se otočit, protože váš oponent přeběhne na poslední žádná záležitost co vy děláte. A tak dále. Pro spolupráci zůstat přitažlivý, pak, budoucnost musí být neurčitá pro oba hráče. Jedno řešení má dělat celkové množství otočení N náhodný.
Další zvláštní případ je " hra navždy " dilema vězeňe. Hra je opakoval nekonečné číslo časů a vaše skóre je průměr (vhodně počítaný).
Dilema vězeňe hra je základní pro jisté teorie lidské spolupráce a důvěry. Na předpokladu, že transakce mezi dvěma osobami vyžadovat důvěra může být modelována dilematem vězeňe, kooperativní chování v populacích může být modelováno multi-hráč, opakovaný, verze hry. To má, následně, fascinovaný mnoho, mnoho učenců za ta léta. Ne zcela nový odhad (Grofman a bazén 1975) dá počet odborných příspěvků oddaných tomu u přes 2, 000.
Tam jsou také některé varianty hry, s důvtipnýma ale důležitými rozdíly v přínosu matrices, který být níže uveden: -
Jiný důležitý non nula-součtový herní typ je volán " kuře ", ve kterém to je vždy v zájmu hráče spolupracovat kterákoliv jiný hráč dělá. V kuřeti vzájemné zběhnutí je nejhorší možný výsledek (od této doby nestálá rovnováha), ale v dilematu vězeňe nejhorší možný výsledek spolupracuje, zatímco jiná osoba přeběhne (tak oba přebíhat je stabilní rovnováha). V obou hrách, " oba spolupracují " je nestálá rovnováha.
Typický matice přínosu by četl:
- Jestliže oba hráči spolupracují, oni každý dostat + 5.
- Jestliže jeden spolupracuje a ostatní vady, první dostane + 1 a jiný dostane + 10.
- Jestliže oba přeběhnou, oni každý dostat - 20.
Hra ujištění má podobnou strukturu k dilematu vězeňe, kromě toho odměny pro vzájemnou spolupráci jsou vyšší než ti pro zběhnutí. Typický plat-pryč matice by četla:
- Jestliže oba hráči spolupracují, oni každý dostat + 10.
- Jestliže vy spolupracujete a jiný chlap přeběhne, vy dostanete + 1 a oni dostanou + 5.
- Jestliže oba přeběhnou, oni každý dostat + 3.
Přítel nebo nepřítel je přehlídka hry nyní vysílání na Hra síť přehlídky. To je příklad dilematu vězeňe hra testovaná fyzickými osobami, ale ve vykonstruovaném nastavení. Na přehlídce hry, tři páry lidí soutěží. Jako každý pár je vyloučen, oni hrají hru dilematu vězeňe určovat jak jejich winnings být rozdělen. Jestliže oni oba spolupracují (" přítel "), oni sdílejí to winnings 50-50. Jestliže jeden spolupracuje a ostatní vady (" nepřítel "), odpadlík dostane celá winnings a cooperator dostane nic. Jestliže oba přeběhnou, oba odejdou s ničím. Poznamenat, že matice přínosu je mírně odlišná od toho standardního daný nahoře, jako platby pro " oba přeběhnou " a " já spolupracuji a oponent přeběhne " případy jsou totožné. Toto dělá " oba přeběhnou " neutrální rovnováha, srovnal s bytím stabilní rovnováha ve standardu dilema vězeňe. Jestliže vy víte to váš oponent bude hlasovat " nepřítel ", pak váš výběr neovlivní vaše winnings. V jistém smyslu, " přítel nebo nepřítel " je mezitím " dilema vězeňe " a " kuře ".
Matice přínosu je
- Jestliže oba hráči spolupracují, oni každý dostat + 1.
- Jestliže oba přeběhnou, oni každý dostat 0.
- Jestliže vy spolupracujete a jiná osoba přeběhne, vy dostanete + 0 a oni dostanou + 2.
Odkazy
- Robert Axelrod Evoluce spolupráce (1984)
- Grofman a Pool (1975). Bayesian modely pro opakovaného vězeňe je dilema hry. Obecné systémy 20:18 5-94.
- William Poundstone Dilema vězeňe: John von Neumann, teorie her, a hádanka bomby. Doubleday, 1992. ISBN 0385415672. Rozsáhlý populární úvod, jak titul ukáže.
Viz též
Vnější spojení
- Hrát opakované vězeňské dilema online