From 7c6d53e9fb8db5009818f18c06ce7bdac48eb54b Mon Sep 17 00:00:00 2001
From: "David A. Madore" <david+git@madore.org>
Date: Sun, 17 Apr 2016 19:45:34 +0200
Subject: An exercise on normal form games.

---
 controle-20160421.tex | 171 +++++++++++++++++++++++++++++++++++++++++++++++++-
 1 file changed, 168 insertions(+), 3 deletions(-)

diff --git a/controle-20160421.tex b/controle-20160421.tex
index 9de25e4..a67231a 100644
--- a/controle-20160421.tex
+++ b/controle-20160421.tex
@@ -15,11 +15,15 @@
 \usepackage{wasysym}
 \usepackage{url}
 %
+\usepackage{xr-hyper}
+%
 \usepackage{graphics}
 \usepackage[usenames,dvipsnames]{xcolor}
 \usepackage{tikz}
 \usetikzlibrary{matrix,calc}
-%\usepackage{hyperref}
+\usepackage{hyperref}
+%
+\externaldocument{notes-mitro206}[notes-mitro206.pdf]
 %
 \theoremstyle{definition}
 \newtheorem{comcnt}{Tout}
@@ -69,9 +73,9 @@
 %
 \begin{document}
 \ifcorrige
-\title{MITRO206\\Contrôle de connaissance — Corrigé\\{\normalsize Théorie des jeux}}
+\title{MITRO206\\Contrôle de connaissances — Corrigé\\{\normalsize Théorie des jeux}}
 \else
-\title{MITRO206\\Contrôle de connaissance\\{\normalsize Théorie des jeux}}
+\title{MITRO206\\Contrôle de connaissances\\{\normalsize Théorie des jeux}}
 \fi
 \author{}
 \date{21 avril 2016}
@@ -112,6 +116,167 @@ Durée : 3h
 %
 %
 
+\exercice
+
+Alice joue contre Bob un jeu dans lequel elle choisit une option parmi
+deux possibles appelées U et V, et Bob choisit une option parmi deux
+appelées X et Y (les modalités du choix varient selon les questions
+ci-dessous) : les gains d'\emph{Alice} (c'est-à-dire, la fonction
+qu'elle cherche à maximiser) sont donnés par le tableau ci-dessous, en
+fonction de son choix (colonne de gauche) et de celui de Bob (ligne du
+haut) :
+
+\begin{center}
+\begin{tabular}{r|ccc}
+$\downarrow$A, B$\rightarrow$&X&Y\\\hline
+U&$3$&$1$\\
+V&$0$&$4$\\
+\end{tabular}
+\end{center}
+
+\smallbreak
+
+(1) On suppose que Bob fait son choix \emph{après} Alice, et en
+connaissant le choix d'Alice, et qu'il cherche à minimiser le gain
+d'Alice (i.e., le gain de Bob est l'opposé de celui d'Alice).  Comment
+Alice a-t-elle intérêt à jouer et comment Bob répondra-t-il ?  Quelle
+est le gain d'Alice dans ce cas ?
+
+\begin{corrige}
+Si Alice choisit U, Bob répondra par Y et le gain d'Alice sera $1$ ;
+si Alice choisit V, Bob répondra par X et le gain d'Alice sera $0$.
+Comme Alice veut maximiser son gain, elle a intérêt à choisir U, et
+Bob répondra par Y, et le gain d'Alice sera $1$ dans ce cas.
+\end{corrige}
+
+\smallbreak
+
+(2) On suppose maintenant que Bob fait son choix \emph{avant} Alice,
+et qu'Alice connaîtra le choix de Bob ; on suppose toujours que Bob
+cherche à minimiser le gain d'Alice.  Que fera Bob et comment Alice
+répondra-t-elle ?  Quelle est le gain d'Alice dans ce cas ?
+
+\begin{corrige}
+Si Bob choisit X, Alice répondra par U et le gain d'Alice sera $3$ ;
+si Bob choisit Y, Alice répondra par V et le gain d'Alice sera $4$.
+Comme Bob veut minimiser le gain d'Alice, il a intérêt à choisir X, et
+Alice répondra par U, et le gain d'Alice sera $3$ dans ce cas.
+\end{corrige}
+
+\smallbreak
+
+(3) On suppose qu'Alice et Bob font leur choix séparément, sans
+connaître le choix de l'autre, et toujours que Bob cherche à minimiser
+le gain d'Alice.  Comment ont-ils intérêt à faire leurs choix ?  Quel
+est le gain (espéré) d'Alice dans ce cas ?
+
+\begin{corrige}
+On a affaire à un jeu à somme nulle écrit en forme normale :
+l'algorithme \ref{zero-sum-games-by-linear-programming-algorithm} nous
+indique qu'on obtient la stratégie optimale d'Alice en résolvant le
+problème de programmation linéaire suivant :
+\[
+\left\{
+\begin{aligned}
+\text{maximiser\ }v&\text{\ avec}\\
+p_U \geq 0\;, \;\; p_V \geq 0&\\
+p_U + p_V &= 1\\
+v - 3p_U - 1p_V &\leq 0\;\;\text{(X)}\\
+v - 0p_U - 4p_V &\leq 0\;\;\text{(Y)}\\
+\end{aligned}
+\right.
+\]
+On peut l'écrire sous forme normale en réécrivant $v = v_+ - v_-$ avec
+$v_+,v_- \geq 0$, mais on gagne un petit peu en remarquant que $v$
+sera forcément positif puisque tous les gains du tableau le sont, donc
+on peut ajouter la contrainte $v \geq 0$.  Une application de
+l'algorithme du simplexe donne finalement l'optimum $v = 2$ atteint
+pour $p_U = \frac{2}{3}$ et $p_V = \frac{1}{3}$, avec pour le dual
+$q_X = \frac{1}{2}$ et $q_Y = \frac{1}{2}$ (les inégalités (X) et (Y)
+sont toutes saturées).
+
+Autrement dit, Alice joue les options U et V avec probabilités
+$\frac{1}{3}$ et $\frac{2}{3}$, Bob réplique avec les options X et Y
+de façon équiprobable, et le gain espéré d'Alice est $2$, qui est la
+valeur du jeu à somme nulle en forme normale considéré ici.
+\end{corrige}
+
+\smallbreak
+
+(4) On suppose maintenant que Bob cherche à \emph{maximiser} le gain
+d'Alice (i.e., il n'est plus son adversaire comme dans les questions
+(1), (2) et (3), mais son allié).  On cherche à déterminer quels sont
+les équilibres de Nash possibles.  On notera $(p_U,p_V, q_X,q_Y)$ un
+profil de stratégies mixtes général, où $p_U,p_V$ (positifs de
+somme $1$) sont les poids des trois options d'Alice (=probabilités
+qu'elle les joue), et $q_X,q_Y$ (positifs, également de somme $1$) les
+poids des trois options de Bob.  On va discuter selon le support des
+stratégies (i.e., selon les ensembles d'options qui ont un poids
+strictement positif).\spaceout (a) Pour commencer, quels sont les
+équilibres de Nash évidents en stratégies pures ?  Expliquer pourquoi
+ce sont bien les seuls équilibres de Nash où l'un des deux joueurs a
+une stratégie pure.\spaceout (b) Calculer ce que doivent valoir $p_U$
+et $p_V$ dans un équilibre de Nash où $q_X > 0$ et $q_Y > 0$ (i.e.,
+les options X et Y de Bob sont dans le support), et ce que dovient
+valoir $q_X$ et $q_Y$ dans un équilibre de Nash où $p_U > 0$ et $p_V >
+0$ (i.e., les options U et V d'Alice sont dans le support).  Ces
+contraintes donnent-elles effectivement un équilibre de
+Nash ?\spaceout (c) Conclure quant à l'ensemble des équilibres de Nash
+du jeu considéré.
+
+\begin{corrige}
+(a) Deux équilibres de Nash sont évidents : si Alice joue (purement) U
+  et Bob joue (purement) X, aucun n'a intérêt à changer puisque $3$
+  est maximum sur la ligne et sur la colonne ; si Alice joue
+  (purement) V et Bob joue (purement) Y, aucun n'a intérêt à changer
+  puisque $4$ est maximum sur la ligne et sur la colonne.  Les gains
+  d'Alice (et de Bob) dans chacun de ces trois cas sont donc $3$
+  et $4$ respectivement.
+
+Il s'agit là de l'ensemble des équilibres de Nash où l'un des deux
+joueurs a une stratégie pure : par exemple, si Alice joue purement U,
+Bob ne peut que répondre par purement X puisque le gain $3$ est
+strictement plus grand que tout autre gain sur la ligne (i.e., donner
+un poids non nul à une autre option de Bob ne pourrait que diminuer le
+gain).
+
+(b) Si $q_X > 0$ et $q_Y > 0$, les stratégies pures X et Y de Bob
+donnent forcément le même gain, car si l'une d'elle donnait un gain
+strictement supérieure à l'autre, Bob aurait intérêt à augmenter le
+poids $q$ correspondant et améliorerait ainsi strictement sa réponse.
+Autrement dit, l'espérance de gain contre la stratégie pure X,
+c'est-à-dire $6 p_U$, est égale à l'espérance de gain contre la
+stratégie pure Y, soit $p_U + 4 p_V$.  On a donc $3 p_U = p_U + 4
+p_V$, et comme aussi $p_U + p_V = 1$ on trouve $(p_U, p_V) =
+(\frac{1}{3}, \frac{2}{3})$ en résolvant le système (soit la même
+stratégie mixte que trouvée en (3), ce qui n'est pas un hasard vu que
+le signe des gains de Bob n'est pas du tout intervenu dans le
+raisonnement).  De même, si $p_U > 0$ et $p_V > 0$, on a $3 q_X + q_Y
+= 4 q_Y$, et comme aussi $q_X + q_Y = 1$ on trouve $(q_X, q_Y) =
+(\frac{1}{2}, \frac{1}{2})$ en résolvant le système (même remarque).
+
+Bref, on a un équilibre de Nash \emph{potentiel} donné par $(p_U,p_V,
+q_X,q_Y) = (\frac{2}{3}, \frac{1}{3}, \frac{1}{2}, \frac{1}{2})$,
+c'est-à-dire exactement le même profil que dans la question (3) quand
+les joueurs étaient adversaires.  Pourtant, aucun des deux joueurs n'a
+(strictement) intérêt à changer unilatéralement sa stratégie puisque
+les deux options qui se présentent à lui sont indifférentes (elles ont
+le même gain espéré) compte tenu du comportement de l'autre.  On a
+donc bien trouvé un troisième équilibre de Nash.
+
+(c) Pour résumer, on a trois équilibres de Nash récapitulés par le
+tableau (triés par ordre de gain espéré décroissant) :
+\begin{center}
+\begin{tabular}{cc|cc|c}
+$p_U$&$p_V$&$q_X$&$q_Y$&gain\\\hline
+$0$&$1$&$0$&$1$&$4$\\
+$1$&$0$&$1$&$0$&$3$\\
+$\frac{2}{3}$&$\frac{1}{3}$&$\frac{1}{2}$&$\frac{1}{2}$&$2$\\
+\end{tabular}
+\end{center}
+et on a prouvé que c'étaient bien les seuls.
+\end{corrige}
+
 
 
 %
-- 
cgit v1.2.3