summaryrefslogtreecommitdiffstats
path: root/controle-20160421.tex
blob: d77b9579edaf730e2ecc3d6e3c301bb19de432cb (plain)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
%% This is a LaTeX document.  Hey, Emacs, -*- latex -*- , get it?
\documentclass[12pt,a4paper]{article}
\usepackage[francais]{babel}
\usepackage[utf8]{inputenc}
\usepackage[T1]{fontenc}
%\usepackage{ucs}
\usepackage{times}
% A tribute to the worthy AMS:
\usepackage{amsmath}
\usepackage{amsfonts}
\usepackage{amssymb}
\usepackage{amsthm}
%
\usepackage{mathrsfs}
\usepackage{wasysym}
\usepackage{url}
%
\usepackage{xr-hyper}
%
\usepackage{graphics}
\usepackage[usenames,dvipsnames]{xcolor}
\usepackage{tikz}
\usetikzlibrary{matrix,calc}
\usepackage{hyperref}
%
\externaldocument{notes-mitro206}[notes-mitro206.pdf]
%
\theoremstyle{definition}
\newtheorem{comcnt}{Tout}
\newcommand\thingy{%
\refstepcounter{comcnt}\smallbreak\noindent\textbf{\thecomcnt.} }
\newcommand\exercice{%
\refstepcounter{comcnt}\bigbreak\noindent\textbf{Exercice~\thecomcnt.}}
\renewcommand{\qedsymbol}{\smiley}
%
\newcommand{\id}{\operatorname{id}}
\newcommand{\Frac}{\operatorname{Frac}}
\newcommand{\degtrans}{\operatorname{deg.tr}}
\newcommand{\Frob}{\operatorname{Frob}}
\newcommand{\alg}{\operatorname{alg}}
\newcommand{\sep}{\operatorname{sep}}
\newcommand{\Gal}{\operatorname{Gal}}
\newcommand{\Fix}{\operatorname{Fix}}
\newcommand{\Hom}{\operatorname{Hom}}
\newcommand{\Divis}{\operatorname{Div}}
\newcommand{\divis}{\operatorname{div}}
\newcommand{\Pic}{\operatorname{Pic}}
\newcommand{\ord}{\operatorname{ord}}
%
\DeclareUnicodeCharacter{00A0}{~}
%
\DeclareMathSymbol{\tiret}{\mathord}{operators}{"7C}
\DeclareMathSymbol{\traitdunion}{\mathord}{operators}{"2D}
%
\DeclareFontFamily{U}{manual}{} 
\DeclareFontShape{U}{manual}{m}{n}{ <->  manfnt }{}
\newcommand{\manfntsymbol}[1]{%
    {\fontencoding{U}\fontfamily{manual}\selectfont\symbol{#1}}}
\newcommand{\dbend}{\manfntsymbol{127}}% Z-shaped
\newcommand{\danger}{\noindent\hangindent\parindent\hangafter=-2%
  \hbox to0pt{\hskip-\hangindent\dbend\hfill}}
%
\newcommand{\spaceout}{\hskip1emplus2emminus.5em}
\newif\ifcorrige
\corrigetrue
\newenvironment{corrige}%
{\ifcorrige\relax\else\setbox0=\vbox\bgroup\fi%
\smallbreak\noindent{\underbar{\textit{Corrigé.}}\quad}}
{{\hbox{}\nobreak\hfill\checkmark}%
\ifcorrige\relax\else\egroup\fi\par}
%
%
%
\begin{document}
\ifcorrige
\title{MITRO206\\Contrôle de connaissances — Corrigé\\{\normalsize Théorie des jeux}}
\else
\title{MITRO206\\Contrôle de connaissances\\{\normalsize Théorie des jeux}}
\fi
\author{}
\date{21 avril 2016}
\maketitle

%% {\footnotesize
%% \immediate\write18{sh ./vc > vcline.tex}
%% \begin{center}
%% Git: \input{vcline.tex}
%% \end{center}
%% \immediate\write18{echo ' (stale)' >> vcline.tex}
%% \par}

\pretolerance=8000
\tolerance=50000

\vskip1truein\relax

\noindent\textbf{Consignes.}

Les exercices sont complètement indépendants.  Ils pourront être
traités dans un ordre quelconque, mais on demande de faire apparaître
de façon très visible dans les copies où commence chaque exercice.

Il n'est pas nécessaire de faire des réponses longues.

L'usage de tous les documents (notes de cours manuscrites ou
imprimées, feuilles d'exercices, livres) est autorisé.

L'usage des calculatrices électroniques est interdit.

Durée : 3h

\pagebreak


%
%
%

\exercice

Alice joue contre Bob un jeu dans lequel elle choisit une option parmi
deux possibles appelées U et V, et Bob choisit une option parmi deux
appelées X et Y (les modalités du choix varient selon les questions
ci-dessous) : les gains d'\emph{Alice} (c'est-à-dire, la fonction
qu'elle cherche à maximiser) sont donnés par le tableau ci-dessous, en
fonction de son choix (colonne de gauche) et de celui de Bob (ligne du
haut) :

\begin{center}
\begin{tabular}{r|ccc}
$\downarrow$A, B$\rightarrow$&X&Y\\\hline
U&$3$&$1$\\
V&$0$&$4$\\
\end{tabular}
\end{center}

\smallbreak

(1) On suppose que Bob fait son choix \emph{après} Alice, et en
connaissant le choix d'Alice, et qu'il cherche à minimiser le gain
d'Alice (i.e., le gain de Bob est l'opposé de celui d'Alice).  Comment
Alice a-t-elle intérêt à jouer et comment Bob répondra-t-il ?  Quelle
est le gain d'Alice dans ce cas ?

\begin{corrige}
Si Alice choisit U, Bob répondra par Y et le gain d'Alice sera $1$ ;
si Alice choisit V, Bob répondra par X et le gain d'Alice sera $0$.
Comme Alice veut maximiser son gain, elle a intérêt à choisir U, et
Bob répondra par Y, et le gain d'Alice sera $1$ dans ce cas.
\end{corrige}

\smallbreak

(2) On suppose maintenant que Bob fait son choix \emph{avant} Alice,
et qu'Alice connaîtra le choix de Bob ; on suppose toujours que Bob
cherche à minimiser le gain d'Alice.  Que fera Bob et comment Alice
répondra-t-elle ?  Quelle est le gain d'Alice dans ce cas ?

\begin{corrige}
Si Bob choisit X, Alice répondra par U et le gain d'Alice sera $3$ ;
si Bob choisit Y, Alice répondra par V et le gain d'Alice sera $4$.
Comme Bob veut minimiser le gain d'Alice, il a intérêt à choisir X, et
Alice répondra par U, et le gain d'Alice sera $3$ dans ce cas.
\end{corrige}

\smallbreak

(3) On suppose qu'Alice et Bob font leur choix séparément, sans
connaître le choix de l'autre, et toujours que Bob cherche à minimiser
le gain d'Alice.  Comment ont-ils intérêt à faire leurs choix ?  Quel
est le gain (espéré) d'Alice dans ce cas ?

\begin{corrige}
On a affaire à un jeu à somme nulle écrit en forme normale :
l'algorithme \ref{zero-sum-games-by-linear-programming-algorithm} nous
indique qu'on obtient la stratégie optimale d'Alice en résolvant le
problème de programmation linéaire suivant :
\[
\left\{
\begin{aligned}
\text{maximiser\ }v&\text{\ avec}\\
p_U \geq 0\;, \;\; p_V \geq 0&\\
p_U + p_V &= 1\\
v - 3p_U - 1p_V &\leq 0\;\;\text{(X)}\\
v - 0p_U - 4p_V &\leq 0\;\;\text{(Y)}\\
\end{aligned}
\right.
\]
On peut l'écrire sous forme normale en réécrivant $v = v_+ - v_-$ avec
$v_+,v_- \geq 0$, mais on gagne un petit peu en remarquant que $v$
sera forcément positif puisque tous les gains du tableau le sont, donc
on peut ajouter la contrainte $v \geq 0$.  Une application de
l'algorithme du simplexe donne finalement l'optimum $v = 2$ atteint
pour $p_U = \frac{2}{3}$ et $p_V = \frac{1}{3}$, avec pour le dual
$q_X = \frac{1}{2}$ et $q_Y = \frac{1}{2}$ (les inégalités (X) et (Y)
sont toutes saturées).

Autrement dit, Alice joue les options U et V avec probabilités
$\frac{1}{3}$ et $\frac{2}{3}$, Bob réplique avec les options X et Y
de façon équiprobable, et le gain espéré d'Alice est $2$, qui est la
valeur du jeu à somme nulle en forme normale considéré ici.
\end{corrige}

\smallbreak

(4) On suppose maintenant que Bob cherche à \emph{maximiser} le gain
d'Alice (i.e., il n'est plus son adversaire comme dans les questions
(1), (2) et (3), mais son allié).  On cherche à déterminer quels sont
les équilibres de Nash possibles.  On notera $(p_U,p_V, q_X,q_Y)$ un
profil de stratégies mixtes général, où $p_U,p_V$ (positifs de
somme $1$) sont les poids des trois options d'Alice (=probabilités
qu'elle les joue), et $q_X,q_Y$ (positifs, également de somme $1$) les
poids des trois options de Bob.  On va discuter selon le support des
stratégies (i.e., selon les ensembles d'options qui ont un poids
strictement positif).\spaceout (a) Pour commencer, quels sont les
équilibres de Nash évidents en stratégies pures ?  Expliquer pourquoi
ce sont bien les seuls équilibres de Nash où l'un des deux joueurs a
une stratégie pure.\spaceout (b) Calculer ce que doivent valoir $p_U$
et $p_V$ dans un équilibre de Nash où $q_X > 0$ et $q_Y > 0$ (i.e.,
les options X et Y de Bob sont dans le support), et ce que dovient
valoir $q_X$ et $q_Y$ dans un équilibre de Nash où $p_U > 0$ et $p_V >
0$ (i.e., les options U et V d'Alice sont dans le support).  Ces
contraintes donnent-elles effectivement un équilibre de
Nash ?\spaceout (c) Conclure quant à l'ensemble des équilibres de Nash
du jeu considéré.

\begin{corrige}
(a) Deux équilibres de Nash sont évidents : si Alice joue (purement) U
  et Bob joue (purement) X, aucun n'a intérêt à changer puisque $3$
  est maximum sur la ligne et sur la colonne ; si Alice joue
  (purement) V et Bob joue (purement) Y, aucun n'a intérêt à changer
  puisque $4$ est maximum sur la ligne et sur la colonne.  Les gains
  d'Alice (et de Bob) dans chacun de ces trois cas sont donc $3$
  et $4$ respectivement.

Il s'agit là de l'ensemble des équilibres de Nash où l'un des deux
joueurs a une stratégie pure : par exemple, si Alice joue purement U,
Bob ne peut que répondre par purement X puisque le gain $3$ est
strictement plus grand que tout autre gain sur la ligne (i.e., donner
un poids non nul à une autre option de Bob ne pourrait que diminuer le
gain).

(b) Si $q_X > 0$ et $q_Y > 0$, les stratégies pures X et Y de Bob
donnent forcément le même gain, car si l'une d'elle donnait un gain
strictement supérieure à l'autre, Bob aurait intérêt à augmenter le
poids $q$ correspondant et améliorerait ainsi strictement sa réponse.
Autrement dit, l'espérance de gain contre la stratégie pure X,
c'est-à-dire $6 p_U$, est égale à l'espérance de gain contre la
stratégie pure Y, soit $p_U + 4 p_V$.  On a donc $3 p_U = p_U + 4
p_V$, et comme aussi $p_U + p_V = 1$ on trouve $(p_U, p_V) =
(\frac{1}{3}, \frac{2}{3})$ en résolvant le système (soit la même
stratégie mixte que trouvée en (3), ce qui n'est pas un hasard vu que
le signe des gains de Bob n'est pas du tout intervenu dans le
raisonnement).  De même, si $p_U > 0$ et $p_V > 0$, on a $3 q_X + q_Y
= 4 q_Y$, et comme aussi $q_X + q_Y = 1$ on trouve $(q_X, q_Y) =
(\frac{1}{2}, \frac{1}{2})$ en résolvant le système (même remarque).

Bref, on a un équilibre de Nash \emph{potentiel} donné par $(p_U,p_V,
q_X,q_Y) = (\frac{2}{3}, \frac{1}{3}, \frac{1}{2}, \frac{1}{2})$,
c'est-à-dire exactement le même profil que dans la question (3) quand
les joueurs étaient adversaires.  Pourtant, aucun des deux joueurs n'a
(strictement) intérêt à changer unilatéralement sa stratégie puisque
les deux options qui se présentent à lui sont indifférentes (elles ont
le même gain espéré) compte tenu du comportement de l'autre.  On a
donc bien trouvé un troisième équilibre de Nash.

(c) Pour résumer, on a trois équilibres de Nash récapitulés par le
tableau (triés par ordre de gain espéré décroissant) :
\begin{center}
\begin{tabular}{cc|cc|c}
$p_U$&$p_V$&$q_X$&$q_Y$&gain\\\hline
$0$&$1$&$0$&$1$&$4$\\
$1$&$0$&$1$&$0$&$3$\\
$\frac{2}{3}$&$\frac{1}{3}$&$\frac{1}{2}$&$\frac{1}{2}$&$2$\\
\end{tabular}
\end{center}
et on a prouvé que c'étaient bien les seuls.
\end{corrige}


%
%
%

\exercice

On considère le jeu suivant : une position du jeu consiste en un
certain nombre (fini) de jetons placés sur un damier transfini dont
les cases étiquetées par un couple $(\alpha,\beta)$ d'ordinaux (on
dira que $\alpha$ est [le numéro de] la ligne de la case et $\beta$
[le numéro de] la colonne).

Un coup du jeu consiste à faire l'opération suivante : le joueur qui
doit jouer choisit un jeton du jeu, disons qu'il soit sur la case
$(\alpha,\beta)$, et il choisit aussi $\alpha' < \alpha$ et $\beta' <
\beta$, il retire le jeton choisi de la case $(\alpha,\beta)$ et le
remplace par \emph{trois} jetons, sur les cases $(\alpha',\beta)$,
$(\alpha,\beta')$ et $(\alpha',\beta')$.  (À titre d'exemple, si le
jeu comporte un seul jeton sur la case $(42,7)$, un coup valable
consiste à le remplacer par trois jetons, sur les cases $(18,7)$,
$(42,5)$ et $(18,5)$.)  Le nombre de jetons présents augmente donc
de $2$ à chaque coup joué.

On remarquera que les jetons sur la ligne ou la colonne $0$ ne peuvent
plus être retirés ou servir de quelque manière que ce soit : on pourra
dire que cette ligne et cette colonne $0$ sont la « défausse » des
jetons.  Le jeu se termine lorsque chacun des jetons est sur la ligne
ou la colonne $0$ (=dans la défausse), car il n'est alors plus
possible de jouer.  Les joueurs (Alice et Bob) jouent à tour de rôle
et celui qui ne peut plus jouer a perdu.

(0) Décrire brièvement le jeu complètement équivalent dans lequel il
n'y a pas de ligne ou de colonne $0$ (on fait démarrer la numérotation
à $1$) et il n'y a pas de défausse (les jetons disparaissent plutôt
qu'être défaussés) : quels sont les types de coups possibles à ce
jeu ?

\begin{corrige}
Les jetons défaussés ne jouant aucun rôle dans le jeu, on peut les
ignorer et obtenir un jeu équivalent.  Les lignes et les colonnes sont
alors numérotés par des ordinaux non nuls, c'est-à-dire $\geq 1$.  Les
quatre types de coups possibles dans ce jeu, selon que $\alpha'$ et/ou
$\beta'$ vaut $0$, sont alors :
\begin{itemize}
\item simplement retirer un jeton de la case $(\alpha,\beta)$ [cas où
  $\alpha' = 0$ et $\beta' = 0$],
\item déplacer un jeton de la case $(\alpha,\beta)$ vers une case
  $(\alpha,\beta')$ plus à gauche (i.e., $\beta' < \beta$) dans la
  ligne [cas où $\alpha' = 0$ et $\beta' \neq 0$],
\item déplacer un jeton de la case $(\alpha,\beta)$ vers une case
  $(\alpha',\beta)$ plus haut (i.e., $\alpha' < \alpha$) dans la
  colonne [cas où $\alpha' \neq 0$ et $\beta' = 0$],
\item remplacer un jeton de la case $(\alpha,\beta)$ par un jeton sur
  une case $(\alpha,\beta')$ plus à gauche dans la ligne, un autre sur
  une case $(\alpha',\beta)$ plus haut dans la colonne, et un
  troisième sur la case $(\alpha',\beta')$ à l'intersection de la
  nouvelle ligne et de la nouvelle colonne, comme dans le jeu
  d'origine [cas où $\alpha' \neq 0$ et $\beta' \neq 0$].
\end{itemize}
\end{corrige}



%
%
%
\end{document}