summaryrefslogtreecommitdiffstats
path: root/notes-mitro206.tex
diff options
context:
space:
mode:
authorDavid A. Madore <david+git@madore.org>2016-02-14 18:46:04 (GMT)
committerDavid A. Madore <david+git@madore.org>2016-02-14 18:46:04 (GMT)
commitafa40cb18857930ab6ef1811b2609c9556ba6a5e (patch)
treeea0b7da55df0165120132a12ca59e5e778dc8e87 /notes-mitro206.tex
parent83268481369a5abb34ba765095f09d3b997f5372 (diff)
downloadmitro206-afa40cb18857930ab6ef1811b2609c9556ba6a5e.zip
mitro206-afa40cb18857930ab6ef1811b2609c9556ba6a5e.tar.gz
mitro206-afa40cb18857930ab6ef1811b2609c9556ba6a5e.tar.bz2
Various gain matrices. Describe the gain of "chicken".
Diffstat (limited to 'notes-mitro206.tex')
-rw-r--r--notes-mitro206.tex102
1 files changed, 81 insertions, 21 deletions
diff --git a/notes-mitro206.tex b/notes-mitro206.tex
index b3424fb..d37e8a3 100644
--- a/notes-mitro206.tex
+++ b/notes-mitro206.tex
@@ -256,11 +256,19 @@ choisit simultanément « gagne » ou « perd ». Si la phrase obtenue en
combinant ces deux mots est « Alice gagne » ou « Bob perd », alors
Alice gagne, si c'est « Alice perd » ou « Bob gagne », alors Bob
gagne. Encore une variante : Alice et Bob choisissent simultanément
-un bit (élément de $\{0,1\}$), si le XOR de ces deux bits vaut $0$
-alors Alice gagne, s'il vaut $1$ c'est Bob. Ce jeu est impartial
-(même s'il n'est pas parfaitement symétrique entre les joueurs) :
-Alice n'a pas d'avantage particulier sur Bob (ce qui est assez évident
-sur ces dernières variantes).
+un bit (élément de $\{\mathtt{0},\mathtt{1}\}$), si le XOR de ces deux
+bits vaut $\mathtt{0}$ alors Alice gagne, s'il vaut $\mathtt{1}$ c'est
+Bob. Ce jeu est impartial (même s'il n'est pas parfaitement
+symétrique entre les joueurs) : Alice n'a pas d'avantage particulier
+sur Bob (ce qui est assez évident sur ces dernières variantes).
+
+\begin{center}
+\begin{tabular}{r|cc}
+$\downarrow$Alice, Bob$\rightarrow$&$\mathtt{0}$/« gagne »&$\mathtt{1}$/« perd »\\\hline
+$\mathtt{0}$/« Alice »&$+1,-1$&$-1,+1$\\
+$\mathtt{1}$/« Bob »&$-1,+1$&$+1,-1$\\
+\end{tabular}
+\end{center}
La notion de coups simultanés peut se convertir en coups engagés dans
une enveloppe scellée (cf. \ref{intro-simultaneous-or-sequential}).
@@ -286,23 +294,45 @@ pierre gagne sur ciseaux (l'intérêt étant qu'il s'agit d'un « ordre »
cyclique, totalement symétrique entre les options). Il s'agit
toujours d'un jeu à somme nulle (disons que gagner vaut $+1$ et perdre
vaut $-1$), et cette fois les deux joueurs sont en situation
-complètement symétrique. On verra que la meilleure stratégie possible
-consiste à choisir chacune des options avec probabilité $\frac{1}{3}$
-(ceci assure une espérance de gain nul quoi que fasse l'autre joueur).
+complètement symétrique.
+
+\begin{center}
+\begin{tabular}{r|ccc}
+$\downarrow$Alice, Bob$\rightarrow$&Pierre&Papier&Ciseaux\\\hline
+Pierre&$0,0$&$-1,+1$&$+1,-1$\\
+Papier&$+1,-1$&$0,0$&$-1,+1$\\
+Ciseaux&$-1,+1$&$+1,-1$&$0,0$\\
+\end{tabular}
+\end{center}
+
+On verra que la meilleure stratégie possible consiste à choisir
+chacune des options avec probabilité $\frac{1}{3}$ (ceci assure une
+espérance de gain nul quoi que fasse l'autre joueur).
Ce jeu s'appelle aussi papier-ciseaux-puits, qui est exactement le
même si ce n'est que « pierre » s'appelle maintenant « puits » (donc
ciseaux gagne sur papier, puits gagne sur ciseaux et papier gagne sur
-puits) : la stratégie optimale est évidemment la même. Certains
-enfants, embrouillés par l'existence des deux variantes, jouent à
-pierre-papier-ciseaux-puits, qui permet les quatre options, et où on
-convient que la pierre tombe dans le puits : quelle est alors la
-stratégie optimale ? il est facile de se convaincre qu'elle consiste à
-ne jamais jouer pierre (qui est strictement « dominée » par puits), et
-jouer papier, ciseaux ou puits avec probabilité $\frac{1}{3}$ chacun
-(cette stratégie garantit un gain au moins nul quoi que fasse l'autre
-adversaire, et même strictement positif s'il joue pierre avec
-probabilité strictement positive).
+puits) : la stratégie optimale est évidemment la même.
+
+Certains enfants, embrouillés par l'existence des deux variantes,
+jouent à pierre-papier-ciseaux-puits, qui permet les quatre options,
+et où on convient que la pierre tombe dans le puits : quelle est alors
+la stratégie optimale ? il est facile de se convaincre qu'elle
+consiste à ne jamais jouer pierre (qui est strictement « dominée » par
+puits), et jouer papier, ciseaux ou puits avec probabilité
+$\frac{1}{3}$ chacun (cette stratégie garantit un gain au moins nul
+quoi que fasse l'autre adversaire, et même strictement positif s'il
+joue pierre avec probabilité strictement positive).
+
+\begin{center}
+\begin{tabular}{r|cccc}
+$\downarrow$Alice, Bob$\rightarrow$&Pierre&Papier&Ciseaux&Puits\\\hline
+Pierre&$0,0$&$-1,+1$&$+1,-1$&$-1,+1$\\
+Papier&$+1,-1$&$0,0$&$-1,+1$&$+1,-1$\\
+Ciseaux&$-1,+1$&$+1,-1$&$0,0$&$-1,+1$\\
+Puits&$+1,-1$&$-1,+1$&$+1,-1$&$0,0$\\
+\end{tabular}
+\end{center}
\thingy Le \textbf{jeu du partage} ou \textbf{de l'ultimatum} : Alice
et Bob ont $10$ points à se partager : Alice choisit un $k$ entre $0$
@@ -356,12 +386,12 @@ gains sont déterminés par la matrice suivante :
\begin{center}
\begin{tabular}{r|cc}
$\downarrow$Alice, Bob$\rightarrow$&Coopère&Défaut\\\hline
-Coopère&$2,2$&$0,3$\\
-Défaut&$3,0$&$1,1$\\
+Coopère&$2,2$&$0,4$\\
+Défaut&$4,0$&$1,1$\\
\end{tabular}
\end{center}
-Ou plus généralement, en remplaçant $3,2,1,0$ par quatre nombres
+Ou plus généralement, en remplaçant $4,2,1,0$ par quatre nombres
$T$ (tentation), $R$ (récompense), $P$ (punition) et
$S$ (\textit{sucker}) tels que $T>R>P>S$. Ces inégalités font que
chaque joueur a intérêt à faire défaut, quelle que soit l'option
@@ -377,6 +407,36 @@ psychologique, politique, philosophique, etc., pour trouver des cadres
d'étude justifiant que la coopération est rationnelle, ou pour montrer
que la notion d'équilibre de Nash est perfectible.
+\thingy Le jeu du \textbf{trouillard}, ou de la \textbf{colombe et du
+ faucon}, obtenu en modifiant les gains du dilemme du prisonnier pour
+pénaliser le double défaut (maintenant appelé rencontre faucon-faucon)
+plus lourdement que la coopération (colombe) face au défaut.
+Autrement dit :
+
+\begin{center}
+\begin{tabular}{r|cc}
+$\downarrow$Alice, Bob$\rightarrow$&Colombe&Faucon\\\hline
+Colombe&$2,2$&$0,4$\\
+Faucon&$4,0$&$-4,-4$\\
+\end{tabular}
+\end{center}
+
+Ou plus généralement, en remplaçant $4,2,0,-4$ par quatre nombres
+$W$ (\textit{win}), $T$ (\textit{truce}), $L$ (\textit{loss}) et
+$X$ (\textit{crash}) tels que $W>T>L>X$. Ces inégalités font que
+chaque joueur a intérêt à faire le contraire de ce que fait l'autre
+(si Bob joue faucon, Alice a intérêt à jouer colombe, et si Bob joue
+colombe, Alice a intérêt à jouer faucon).
+
+On pourra se convaincre que ce jeu a trois équilibres de Nash
+(cf. \ref{definition-best-response-and-nash-equilibrium}) : l'un où
+Alice joue colombe et Bob joue faucon, un deuxième où c'est le
+contraire, et un troisième où chacun joue colombe ou faucon avec les
+probabilités respectives $\frac{L-X}{W-T + L-X}$ et $\frac{W-T}{W-T +
+ L-X}$ (avec les valeurs ci-desssus : $\frac{2}{3}$ et
+$\frac{1}{3}$), pour un gain attendu de $\frac{LW - TX}{W-T + L-X}$
+(avec les valeurs ci-dessus : $\frac{4}{3}$).
+
\thingy Un jeu idiot : Alice et Bob choisissent simultanément chacun
un entier naturel. Celui qui a choisi le plus grand gagne (en cas
d'égalité, on peut déclarer le nul, ou décider arbitrairement qu'Alice