From afa40cb18857930ab6ef1811b2609c9556ba6a5e Mon Sep 17 00:00:00 2001 From: "David A. Madore" Date: Sun, 14 Feb 2016 19:46:04 +0100 Subject: Various gain matrices. Describe the gain of "chicken". --- notes-mitro206.tex | 102 ++++++++++++++++++++++++++++++++++++++++++----------- 1 file changed, 81 insertions(+), 21 deletions(-) diff --git a/notes-mitro206.tex b/notes-mitro206.tex index b3424fb..d37e8a3 100644 --- a/notes-mitro206.tex +++ b/notes-mitro206.tex @@ -256,11 +256,19 @@ choisit simultanément « gagne » ou « perd ». Si la phrase obtenue en combinant ces deux mots est « Alice gagne » ou « Bob perd », alors Alice gagne, si c'est « Alice perd » ou « Bob gagne », alors Bob gagne. Encore une variante : Alice et Bob choisissent simultanément -un bit (élément de $\{0,1\}$), si le XOR de ces deux bits vaut $0$ -alors Alice gagne, s'il vaut $1$ c'est Bob. Ce jeu est impartial -(même s'il n'est pas parfaitement symétrique entre les joueurs) : -Alice n'a pas d'avantage particulier sur Bob (ce qui est assez évident -sur ces dernières variantes). +un bit (élément de $\{\mathtt{0},\mathtt{1}\}$), si le XOR de ces deux +bits vaut $\mathtt{0}$ alors Alice gagne, s'il vaut $\mathtt{1}$ c'est +Bob. Ce jeu est impartial (même s'il n'est pas parfaitement +symétrique entre les joueurs) : Alice n'a pas d'avantage particulier +sur Bob (ce qui est assez évident sur ces dernières variantes). + +\begin{center} +\begin{tabular}{r|cc} +$\downarrow$Alice, Bob$\rightarrow$&$\mathtt{0}$/« gagne »&$\mathtt{1}$/« perd »\\\hline +$\mathtt{0}$/« Alice »&$+1,-1$&$-1,+1$\\ +$\mathtt{1}$/« Bob »&$-1,+1$&$+1,-1$\\ +\end{tabular} +\end{center} La notion de coups simultanés peut se convertir en coups engagés dans une enveloppe scellée (cf. \ref{intro-simultaneous-or-sequential}). @@ -286,23 +294,45 @@ pierre gagne sur ciseaux (l'intérêt étant qu'il s'agit d'un « ordre » cyclique, totalement symétrique entre les options). Il s'agit toujours d'un jeu à somme nulle (disons que gagner vaut $+1$ et perdre vaut $-1$), et cette fois les deux joueurs sont en situation -complètement symétrique. On verra que la meilleure stratégie possible -consiste à choisir chacune des options avec probabilité $\frac{1}{3}$ -(ceci assure une espérance de gain nul quoi que fasse l'autre joueur). +complètement symétrique. + +\begin{center} +\begin{tabular}{r|ccc} +$\downarrow$Alice, Bob$\rightarrow$&Pierre&Papier&Ciseaux\\\hline +Pierre&$0,0$&$-1,+1$&$+1,-1$\\ +Papier&$+1,-1$&$0,0$&$-1,+1$\\ +Ciseaux&$-1,+1$&$+1,-1$&$0,0$\\ +\end{tabular} +\end{center} + +On verra que la meilleure stratégie possible consiste à choisir +chacune des options avec probabilité $\frac{1}{3}$ (ceci assure une +espérance de gain nul quoi que fasse l'autre joueur). Ce jeu s'appelle aussi papier-ciseaux-puits, qui est exactement le même si ce n'est que « pierre » s'appelle maintenant « puits » (donc ciseaux gagne sur papier, puits gagne sur ciseaux et papier gagne sur -puits) : la stratégie optimale est évidemment la même. Certains -enfants, embrouillés par l'existence des deux variantes, jouent à -pierre-papier-ciseaux-puits, qui permet les quatre options, et où on -convient que la pierre tombe dans le puits : quelle est alors la -stratégie optimale ? il est facile de se convaincre qu'elle consiste à -ne jamais jouer pierre (qui est strictement « dominée » par puits), et -jouer papier, ciseaux ou puits avec probabilité $\frac{1}{3}$ chacun -(cette stratégie garantit un gain au moins nul quoi que fasse l'autre -adversaire, et même strictement positif s'il joue pierre avec -probabilité strictement positive). +puits) : la stratégie optimale est évidemment la même. + +Certains enfants, embrouillés par l'existence des deux variantes, +jouent à pierre-papier-ciseaux-puits, qui permet les quatre options, +et où on convient que la pierre tombe dans le puits : quelle est alors +la stratégie optimale ? il est facile de se convaincre qu'elle +consiste à ne jamais jouer pierre (qui est strictement « dominée » par +puits), et jouer papier, ciseaux ou puits avec probabilité +$\frac{1}{3}$ chacun (cette stratégie garantit un gain au moins nul +quoi que fasse l'autre adversaire, et même strictement positif s'il +joue pierre avec probabilité strictement positive). + +\begin{center} +\begin{tabular}{r|cccc} +$\downarrow$Alice, Bob$\rightarrow$&Pierre&Papier&Ciseaux&Puits\\\hline +Pierre&$0,0$&$-1,+1$&$+1,-1$&$-1,+1$\\ +Papier&$+1,-1$&$0,0$&$-1,+1$&$+1,-1$\\ +Ciseaux&$-1,+1$&$+1,-1$&$0,0$&$-1,+1$\\ +Puits&$+1,-1$&$-1,+1$&$+1,-1$&$0,0$\\ +\end{tabular} +\end{center} \thingy Le \textbf{jeu du partage} ou \textbf{de l'ultimatum} : Alice et Bob ont $10$ points à se partager : Alice choisit un $k$ entre $0$ @@ -356,12 +386,12 @@ gains sont déterminés par la matrice suivante : \begin{center} \begin{tabular}{r|cc} $\downarrow$Alice, Bob$\rightarrow$&Coopère&Défaut\\\hline -Coopère&$2,2$&$0,3$\\ -Défaut&$3,0$&$1,1$\\ +Coopère&$2,2$&$0,4$\\ +Défaut&$4,0$&$1,1$\\ \end{tabular} \end{center} -Ou plus généralement, en remplaçant $3,2,1,0$ par quatre nombres +Ou plus généralement, en remplaçant $4,2,1,0$ par quatre nombres $T$ (tentation), $R$ (récompense), $P$ (punition) et $S$ (\textit{sucker}) tels que $T>R>P>S$. Ces inégalités font que chaque joueur a intérêt à faire défaut, quelle que soit l'option @@ -377,6 +407,36 @@ psychologique, politique, philosophique, etc., pour trouver des cadres d'étude justifiant que la coopération est rationnelle, ou pour montrer que la notion d'équilibre de Nash est perfectible. +\thingy Le jeu du \textbf{trouillard}, ou de la \textbf{colombe et du + faucon}, obtenu en modifiant les gains du dilemme du prisonnier pour +pénaliser le double défaut (maintenant appelé rencontre faucon-faucon) +plus lourdement que la coopération (colombe) face au défaut. +Autrement dit : + +\begin{center} +\begin{tabular}{r|cc} +$\downarrow$Alice, Bob$\rightarrow$&Colombe&Faucon\\\hline +Colombe&$2,2$&$0,4$\\ +Faucon&$4,0$&$-4,-4$\\ +\end{tabular} +\end{center} + +Ou plus généralement, en remplaçant $4,2,0,-4$ par quatre nombres +$W$ (\textit{win}), $T$ (\textit{truce}), $L$ (\textit{loss}) et +$X$ (\textit{crash}) tels que $W>T>L>X$. Ces inégalités font que +chaque joueur a intérêt à faire le contraire de ce que fait l'autre +(si Bob joue faucon, Alice a intérêt à jouer colombe, et si Bob joue +colombe, Alice a intérêt à jouer faucon). + +On pourra se convaincre que ce jeu a trois équilibres de Nash +(cf. \ref{definition-best-response-and-nash-equilibrium}) : l'un où +Alice joue colombe et Bob joue faucon, un deuxième où c'est le +contraire, et un troisième où chacun joue colombe ou faucon avec les +probabilités respectives $\frac{L-X}{W-T + L-X}$ et $\frac{W-T}{W-T + + L-X}$ (avec les valeurs ci-desssus : $\frac{2}{3}$ et +$\frac{1}{3}$), pour un gain attendu de $\frac{LW - TX}{W-T + L-X}$ +(avec les valeurs ci-dessus : $\frac{4}{3}$). + \thingy Un jeu idiot : Alice et Bob choisissent simultanément chacun un entier naturel. Celui qui a choisi le plus grand gagne (en cas d'égalité, on peut déclarer le nul, ou décider arbitrairement qu'Alice -- cgit v1.2.3