menu předchozí

Půjčka za oplátku

následující

JEFF:
Pokud se hra Vězňovo dilema hraje na více kol než jedno, ukazuje se, že sobectví není ani zdaleka ten racionální postup.
Dva muži kolegové Armen a John byli požádáni, aby si hru zahráli o malé peněžní částky stokrát za sebou, Jejich pokusní králíci celkem ochotně spolupracovali. V šedesáti případech ze sta na sebe byli hodní, a sklízeli tak ovoce ze vzájemné spolupráce. V poznámkách, které si během hry vedli, oba přiznali, že se k partnerovi chovají vstřícně, aby ho svedli ke vstřícnosti v příštím kole - a to až do závěru hry, kdy oba doufali v rychlou koncovku zahranou na úkor protihráče. Když pak jiná dvojice opakovaně hrála na nekonečný počet kol, zdálo se, že vstřícnost převažovala nad škodolibostí.
Na tento turnaj se záhy zapomnělo. Avšak pokaždé když měli dva lidé hru sehrát, pokoušeli se o spolupráci, tedy o logicky chybnou taktiku. Tato skoro nemístná ochota kooperovat byla blahosklonně omlouvána nedostatečnou racionalitou hráčů a v podstatě nevysvětlitelnými sympatiemi k bližnímu. „Ukazuje se,“ psal jeden znalec teorie her, „že průměrní hráči nejsou strategicky dost nadaní, aby přišli na to, že strategie DD (oba se podrážejí, z anglického defect – zradit) je jedinou logicky opodstatněnou variantou.“ Podstata problému všem unikala.

JIRKA:
Mně to připadá lidsky rozumné. Hrát trvale strategii DD pokládám za zločinecké.

JEFF:
Hmm! Poslouchejte dál.
Koncem 70. let se začalo dít něco podivného. Do teorie her se pustily počítače se svými studenými a tvrdě racionálními mozky. K velkému překvapení však hrály stejně hloupě a naivně jako lidé - vykazovaly iracionální sklon kooperovat. Matematikové bili na poplach.
Roku 1979 vyhlásil mladý politolog Robert Axelrod soutěž, která měla tuto podivnost objasnit. Vyzval matematiky, aby napsali programy, které by sehrály 200 kol hry proti všem ostatním programům, samy proti sobě a proti náhodně vybranému programu. Na konci soutěže měly být programy vyhodnoceny podle počtu získaných bodů.

JIRKA:
To zní velmi zajímavě.

JEFF:
Různě složité programy mu poslalo celkem čtrnáct lidí. Ke všeobecnému údivu se ukázalo, že „hodné“ programy byly při hře nejúspěšnější. Žádný z osmi nejlepších programů na počátku hry nepodrazil svého protihráče. Absolutním vítězem se navíc stal vůbec nejhodnější - a nejjednodušší - ze všech programů. Kanadský politolog Anatol Rapoport, který se zajímal o otázky jaderného zbrojení, svého času byl profesionálním pianistou a pravděpodobně věděl o teorii her víc než kdokoli jiný, sepsal primitivní program Tit-for-tat (anglické přísloví rovnocenné odplaty), což se překládá jako Něco za něco nebo Oko za oko či Půjčka za oplátku. Hráč, který se řídí Půjčkou za oplátku, v prvém kole jednoduše spolupracuje a v dalších kolech se zachová tak, jak se k němu naposled zachoval protihráč. Strategie má čtyři podmínky:

Důležité je, že soutěž pokračuje tak dlouho, aby opakovaní trestu a odpuštění vytvářelo dlouhodobou návratnost z případné ztráty z počátku hry. Je tu ještě pátá podmínka, aby soutěž měla smysl: Pokud hráč ví, že příští hra bude poslední, bude ho to nutit ke změně, aby získal vyšší skóre. Podobně, pokud ví, že další dvě hry budou poslední, zase bude mít snahu přeběhnout dvakrát, a tak dále. Proto počet soutěží nesmí být hráčům znám předem.
Poté Axelrod vyhlásil další soutěž, jejíž účastníci měli napsat program, který by porazil program Tit-for-tat. Sešlo se celkem 60 programů, ale jediným vítězem se stala… samotná Půjčka za oplátku! Opět se ukázala jako jednička.
V knize, kterou o teorii her Axelrod napsal, se uvádí:
Za ohromný úspěch Půjčky za oplátku může kombinace její vstřícnosti, oplácení, schopnosti odpouštět a čitelnosti. Chová se vstřícně, takže se nedostává do zbytečných konfliktů. Podrazy dokáže oplácet stejnou kartou, a tím protihráče odradí od trvání na tricích, které by na ni chtěli zkoušet. Dokáže odpouštět, takže může obnovit vzájemnou spolupráci. A konečně je dostatečně čitelná, což protihráče motivuje k dlouhodobé spolupráci.
Následující Axelrodův experiment postavil všechny programy proti sobě v jakési darwinovské válce, v níž šlo o „přežití nejzdatnějších“. Pokus byl jednou z prvních vlaštovek mnoha pozdějších experimentů s „umělým životem“. Přírodní výběr, onu hybnou sílu evoluce, lze na počítači snadno simulovat: softwaroví tvorové se rozmnožují a soupeří o životní prostor na monitoru počítače stejně, jako se skuteční tvorové rozmnožují a soupeří o prostor v reálném světě.
V Axelrodově verzi se neúspěšné programy postupně posouvaly k okrajům monitoru, zatímco schopné programy se držely ve středovém poli. Průběh soutěže mezi programy byl fascinující. Na počátku prosperovaly podrazácké strategie na úkor dobromyslných naivků. Pouze tvorové schopní oplácet špatné špatným, například Půjčka za oplátku, drželi s podrazáky krok. Zakrátko však podrazáci vyhubili snadné oběti a nevyhnutelně se začali střetávat s programy stejného založení; tím nastaly i jim zlé časy. Byla to chvíle pro program Půjčka za oplátku, který se nakonec opět zmocnil vlády nad bitevním polem.

JIRKA:
To je úžasné! Nemám slov.

JEFF:
Strategie Půjčka za oplátku byla zjištěna ve spontánním nenásilném chování, které vzniklo během zákopové války v první světové válce, a které se nazývá „žít a nechat žít“. Vojska nepřátel byla v zákopech jen několik set metrů od sebe. Pokud odstřelovač jedné strany zabil vojáka na druhé, mohla se očekávat vzápětí stejná odplata. Naopak, pokud nikdo po nějakou dobu nebyl zabit, druhá strana uznala toto implicitní „příměří“ a podle toho jednala. Tak se vytvořil mezi zákopy „separátní mír“.

JIRKA:
Lze najít něco analogického mezi zvířaty?

JEFF:
Samozřejmě. Zde je několik stručných příkladů.

  spolupráce zrada - oškubání odměna pokušení trest
samci paviána anubiho pomoci druhému samečkovi při páření zahánět nepřítele neoplatit pomoc úspěšné páření, mláďata využít pomoc, ale neoplatit ji a tím ušetřit čas a námahu méně mláďat
v přírodě platí čím častěji sameček A podporuje samečka B, tím častěji i B podporuje A
  spolupráce zrada - oškubání odměna pokušení trest
fíkovník a vosičky chalcidky vyvážený poměr mezi květy, které chalcidka uvnitř fíku opyluje, a květy, do nichž naklade vajíčka naklást vajíčka do více květů šíření genů naklást vajíčka do více květů a tím zvýšit počet potomků fík i s celou „zrádnou rodinou“ shozen, rodina vymírá
Upír Desmodus rotundus (netopýr sající krev savců ) –krmení hladových jedinců po úspěšném lovu nakrmit neúspěšné „kolegy“ nechat si vše pro sebe dlouhodobé úspěšné přežívání v případě nouze se nechat nakrmit, o svůj úlovek se však nedělit v případě neúspěšného lovu smrt vyhladověním
v přírodě platí Jedinci, kteří se vrátili z neúspěšného lovu, jsou úspěšnými, a to i nepříbuznými, krmeni; poznají se.

JIRKA:
Myslím, že na tomto bychom mohli dnes skončit. Mám-li shrnout dnešní hlavní myšlenku, řekl bych toto: vždy se vyplatí spolupráce, ale ne naivita.


začátek