%% This is a LaTeX document. Hey, Emacs, -*- latex -*- , get it? \documentclass[12pt,a4paper]{article} \usepackage[english,francais]{babel} \usepackage[utf8]{inputenc} \usepackage[T1]{fontenc} %\usepackage{ucs} \usepackage{times} % A tribute to the worthy AMS: \usepackage{amsmath} \usepackage{amsfonts} \usepackage{amssymb} \usepackage{amsthm} % \usepackage{mathrsfs} \usepackage{wasysym} \usepackage{url} % %\usepackage{xr-hyper} % \usepackage{graphics} \usepackage[usenames,dvipsnames]{xcolor} \usepackage{tikz} \usetikzlibrary{matrix,calc} \usepackage{hyperref} % %\externaldocument{notes-mitro206}[notes-mitro206.pdf] % \theoremstyle{definition} \newtheorem{comcnt}{Tout} \newcommand\thingy{% \refstepcounter{comcnt}\smallbreak\noindent\textbf{\thecomcnt.} } \newcommand\exercice{% \refstepcounter{comcnt}\bigbreak\noindent\textbf{Exercice~\thecomcnt.}} \renewcommand{\qedsymbol}{\smiley} % \newcommand{\outnb}{\operatorname{outnb}} \newcommand{\downstr}{\operatorname{downstr}} \newcommand{\precs}{\operatorname{precs}} \newcommand{\mex}{\operatorname{mex}} \newcommand{\id}{\operatorname{id}} \newcommand{\limp}{\Longrightarrow} \newcommand{\gr}{\operatorname{gr}} \newcommand{\rk}{\operatorname{rk}} \newcommand{\fuzzy}{\mathrel{\|}} % \DeclareUnicodeCharacter{00A0}{~} % \DeclareMathSymbol{\tiret}{\mathord}{operators}{"7C} \DeclareMathSymbol{\traitdunion}{\mathord}{operators}{"2D} % \DeclareFontFamily{U}{manual}{} \DeclareFontShape{U}{manual}{m}{n}{ <-> manfnt }{} \newcommand{\manfntsymbol}[1]{% {\fontencoding{U}\fontfamily{manual}\selectfont\symbol{#1}}} \newcommand{\dbend}{\manfntsymbol{127}}% Z-shaped \newcommand{\danger}{\noindent\hangindent\parindent\hangafter=-2% \hbox to0pt{\hskip-\hangindent\dbend\hfill}} % \newcommand{\spaceout}{\hskip1emplus2emminus.5em} \newif\ifcorrige \corrigetrue \newenvironment{corrige}% {\ifcorrige\relax\else\setbox0=\vbox\bgroup\fi% \smallbreak\noindent{\underbar{\textit{Corrigé.}}\quad}} {{\hbox{}\nobreak\hfill\checkmark}% \ifcorrige\relax\else\egroup\fi\par} % % % \begin{document} \ifcorrige \title{MITRO206\\Contrôle de connaissances — Corrigé\\{\normalsize Théorie des jeux}} \else \title{MITRO206\\Contrôle de connaissances\\{\normalsize Théorie des jeux}} \fi \author{} \date{19 avril 2017} \maketitle %% {\footnotesize %% \immediate\write18{sh ./vc > vcline.tex} %% \begin{center} %% Git: \input{vcline.tex} %% \end{center} %% \immediate\write18{echo ' (stale)' >> vcline.tex} %% \par} \pretolerance=8000 \tolerance=50000 \vskip1truein\relax \noindent\textbf{Consignes.} Les exercices sont totalement indépendants. Ils pourront être traités dans un ordre quelconque, mais on demande de faire apparaître de façon très visible dans les copies où commence chaque exercice. Une traduction anglaise suit l'énoncé en français. \medbreak L'usage de tous les documents (notes de cours manuscrites ou imprimées, feuilles d'exercices, livres) est autorisé. L'usage des appareils électroniques est interdit. \medbreak Durée : 1h30 \vskip3ex \begin{otherlanguage}{english} {\footnotesize \noindent\textbf{Instructions.} The following exercises are independent. They can be answered in any order, but the beginning and end of each exercise should be clearly marked. An English translation follows the questions in French. The use of all documents (handwritten or printed course notes, exercise sheets, books) is permitted. The use of electronic devices is forbidden. Duration: 1h30 \par} \end{otherlanguage} \vfill {\noindent\tiny \immediate\write18{sh ./vc > vcline.tex} Git: \input{vcline.tex} \immediate\write18{echo ' (stale)' >> vcline.tex} \par} \pagebreak % % % \exercice\label{hackenbush-exercise} On s'intéresse dans cet exercice au jeu de \emph{Hackenbush impartial en arbre}, défini comme suit. L'état du jeu est représenté par un arbre (fini, enraciné\footnote{C'est-à-dire que la racine fait partie de la donnée de l'arbre, ce qui est la convention la plus courante.}). Deux joueurs alternent et chacun à son tour choisit une arête de l'arbre et l'efface, ce qui fait automatiquement disparaître du même coup tout le sous-arbre qui descendait de cette arête (voir figure). Le jeu se termine lorsque plus aucun coup n'est possible (c'est-à-dire que l'arbre est réduit à sa seule racine), auquel cas, selon la convention habituelle, le joueur qui ne peut plus jouer a perdu. \begin{center} \begin{tikzpicture}[baseline=0] \fill [gray!50!white] (-1.5,0) rectangle (1.5,-0.2); \begin{scope}[every node/.style={circle,fill,inner sep=0.5mm}] \node (P0) at (0,0) {}; \node (P1) at (0,1) {}; \node (P2) at (-1.5,2) {}; \node (P3) at (-2.0,3) {}; \node (P4) at (-1.0,3) {}; \node (P5) at (1.5,2) {}; \node (P6) at (0.75,3) {}; \node (P7) at (1.5,3) {}; \node (P8) at (2.25,3) {}; \node (P9) at (1.75,1) {}; \end{scope} \begin{scope}[line width=1.5pt] \draw (P0) -- (P1); \draw (P1) -- (P2); \draw (P1) -- (P5); \draw (P2) -- (P3); \draw (P2) -- (P4); \draw (P5) -- (P6); \draw (P5) -- (P7); \draw (P5) -- (P8); \draw (P0) -- (P9); \end{scope} \begin{scope}[line width=3pt,red] \draw ($0.5*(P1) + 0.5*(P5) + (-0.2,-0.2)$) -- ($0.5*(P1) + 0.5*(P5) + (0.2,0.2)$); \draw ($0.5*(P1) + 0.5*(P5) + (-0.2,0.2)$) -- ($0.5*(P1) + 0.5*(P5) + (0.2,-0.2)$); \end{scope} \end{tikzpicture} devient \begin{tikzpicture}[baseline=0] \fill [gray!50!white] (-1.5,0) rectangle (1.5,-0.2); \begin{scope}[every node/.style={circle,fill,inner sep=0.5mm}] \node (P0) at (0,0) {}; \node (P1) at (0,1) {}; \node (P2) at (-1.5,2) {}; \node (P3) at (-2.0,3) {}; \node (P4) at (-1.0,3) {}; \node (P9) at (1.75,1) {}; \end{scope} \begin{scope}[line width=1.5pt] \draw (P0) -- (P1); \draw (P1) -- (P2); \draw (P2) -- (P3); \draw (P2) -- (P4); \draw (P0) -- (P9); \end{scope} \end{tikzpicture} \end{center} (1) Expliquer pourquoi une position de ce jeu peut être considérée comme une somme de nim de différents jeux du même type. Plus exactement, soit $T$ un arbre de racine $x$, soient $y_1,\ldots,y_r$ les fils de $x$, soient $T_1,\ldots,T_r$ les sous-arbres ayant pour racines $y_1,\ldots,y_r$ et soient $T'_1,\ldots,T'_r$ les arbres de racine $x$ où $T'_i$ est formé de $x$ et de $T_i$ (avec une arête entre $x$ et $y_i$) : expliquer pourquoi la position représentée par l'arbre $T$ est la somme de nim de celles représentées par $T'_1,\ldots,T'_r$. Qu'en déduit-on sur la valeur de Grundy de la position $T$ ? \begin{corrige} Il s'agit simplement d'observer que les différentes branches de l'arbre n'interagissent pas du tout. Jouer à la somme de nim des jeux de Hackenbush représentés par les arbres $T'_1,\ldots,T'_r$ revient, si on veut, à jouer à Hackenbush sur la réunion disjointe de ces arbres, et comme la racine n'intervient pas, cela ne change rien au jeu de réunir leurs racines en une seule, ce qui donne l'arbre $T$. On en déduit que $\gr(T) = \gr(T'_1) \oplus \cdots \gr(T'_r)$ où $\gr(T)$ désigne, par abus de notation, la valeur de Grundy de la position de Hackenbush représentée par l'arbre $T$, et où $\oplus$ désigne la somme de nim des entiers naturels. \end{corrige} \smallbreak \centerline{* * *} Indépendamment de ce qui précède, on va considérer une nouvelle opération sur les jeux : si $G$ est un jeu combinatoire impartial, vu comme un graphe orienté (bien-fondé), on définit un jeu noté $*{:}G$ défini en ajoutant une unique position $0$ à $G$ comme on va l'expliquer. Pour chaque position $z$ de $G$ il y a une position notée $*{:}z$ de $*{:}G$, et il y a une unique autre position, notée $0$, dans $*{:}G$ ; pour chaque arête $z \to z'$ de $G$, il y a une arête $*{:}z\, \to \, *{:}z'$ dans $*{:}G$, et il y a de plus une arête $*{:}z\, \to 0$ dans $*{:}G$ pour chaque $z$ (en revanche, $0$ est un puits, c'est-à-dire qu'aucune arête n'en part) ; la position initiale de $*{:}G$ est $*{:}z_0$ où $z_0$ est celle de $G$. De façon plus informelle, pour jouer au jeu $*{:}G$, chaque joueur peut soit faire un coup normal ($*{:}z\, \to \, *{:}z'$) de $G$, soit appliquer un coup « destruction totale » $*{:}z\, \to 0$ qui fait terminer immédiatement le jeu (et celui qui l'applique a gagné\footnote{Ce jeu considéré tout seul n'est donc pas très amusant puisqu'on a toujours la possibilité de gagner instantanément.}). \smallbreak (2) Montrer par induction bien-fondée que si $G$ est un jeu combinatoire impartial (bien-fondé) de valeur de Grundy $\alpha$, alors $*{:}G$ a pour valeur de Grundy $1+\alpha$. \begin{corrige} Observons tout d'abord que la valeur de Grundy de la position $0$ de $*{:}G$ vaut $0$ puisque c'est un puits. Montrons par induction bien-fondée sur les sommets de $*{:}G$ que la valeur de Grundy de la position $*{:}z$ vaut $1+\gr(z)$ où $\gr(z)$ désigne la valeur de Grundy de la position $z$ dans $G$. Les voisins sortants de $*{:}z$ sont $0$ et les $*{:}z'$ pour $z'$ voisin sortant de $z$ (dans $G$) ; la définition de la valeur de Grundy assure donc que $\gr(*{:}z) = \mex(\{0\} \cup \{\gr(*{:}z') : z'\in\outnb(z)\})$, c'est-à-dire que la valeur de Grundy de $*{:}z$ est le plus petit ordinal qui n'est ni $0$ ni un $\gr(*{:}z')$ pour $z'$ voisin sortant de $z$ ; mais par hypothèse d'induction, on peut remplacer $\gr(*{:}z')$ par $1+\gr(z')$, ce qui donne $\gr(*{:}z) = \mex(\{0\} \cup \{1+\gr(z') : z'\in\outnb(z)\})$. Montrons que ce $\mex$ vaut $1+\gr(z)$ : pour cela, il suffit d'observer que (A) $1+\gr(z)$ ne vaut ni $0$ ni $1+\gr(z')$, et (B) tout ordinal $<1+\gr(z)$ vaut soit $0$ soit $1+\gr(z')$. Or le (A) est clair car $1+\gr(z) > 0$ et que $\gr(z') \neq \gr(z)$ assure $1+\gr(z') \neq 1+\gr(z)$, et le (B) est clair car si $\beta < 1+\gr(z)$, alors soit $\beta=0$ soit $\beta = 1+\beta'$ où $\beta' < \gr(z)$, auquel cas la définition de $\gr$ assure qu'il existe $z'$ voisin sortant de $z$ tel que $\beta' = \gr(z')$. \end{corrige} \smallbreak (3) On revient au jeu de Hackenbush impartial en arbre. Soit $T$ un arbre de racine $y$ et $T'$ l'arbre obtenu en ajoutant une nouvelle racine $x$ à $T$, c'est-à-dire que les sommets de $T'$ sont ceux de $T$ plus $x$, qui en est la racine, avec une arête entre $x$ et $y$. Expliquer pourquoi le jeu de Hackenbush représenté par $T'$ s'obtient par la construction « $*{:}$ » considérée en (2) à partir de celui représenté par $T$. Qu'en déduit-on sur la valeur de Grundy de la position $T'$ par rapport à celle de $T$ ? \begin{corrige} Un coup dans le jeu de Hackenbush représenté par l'arbre $T'$ peut consister soit à couper l'arbre à sa racine, c'est-à-dire couper l'arête reliant $x$ et $y$, ce qui met fin au jeu immédiatement, soit à jouer dans $T$ (i.e., couper une arête de celui-ci) ; c'est précisément la définition qu'on a donnée de la construction « $*{:}$ ». On en déduit que $\gr(T') = 1 + \gr(T)$ (comme par ailleurs on a ici affaire à des entiers naturels, le $+$ est commutatif, donc dans cette question on peut aussi l'écrire $\gr(T') = \gr(T) + 1$). \end{corrige} \smallbreak (4) Déduire des questions précédentes une méthode pour calculer la valeur de Grundy d'une position quelconque au Hackenbush impartial en arbre. \begin{corrige} Des questions précédentes, on déduit que la valeur de Grundy d'un arbre $T$ au Hackenbush impartial se calcule comme la somme de nim des $\gr(T'_i) = 1+\gr(T_i)$ où les $T_i$ sont les sous-arbres partant des fils de la racine de $T$. On peut donc calculer la valeur de Grundy d'un arbre en calculant celle de ses sous-arbres enracinés aux différents nœuds, des feuilles vers la racine : dès qu'on a calculé la valeur de Grundy de tous les sous-arbres enracinés aux fils $y_1,\ldots,y_r$ d'un nœud $x$, on en déduit celle du sous-arbre enraciné en leur père $x$ comme la somme de nim des valeurs en question incrémentées de $1$. \end{corrige} \smallbreak (5) Quelle est la valeur de Grundy de la position représentée ci-dessous ? (Il s'agit de la position utilisée en exemple plus haut.) Quel coup préconiseriez-vous dans cette situation ? \begin{center} \begin{tikzpicture}[baseline=0] \fill [gray!50!white] (-1.5,0) rectangle (1.5,-0.2); \begin{scope}[every node/.style={circle,fill,inner sep=0.5mm}] \node (P0) at (0,0) {}; \node (P1) at (0,1) {}; \node (P2) at (-1.5,2) {}; \node (P3) at (-2.0,3) {}; \node (P4) at (-1.0,3) {}; \node (P5) at (1.5,2) {}; \node (P6) at (0.75,3) {}; \node (P7) at (1.5,3) {}; \node (P8) at (2.25,3) {}; \node (P9) at (1.75,1) {}; \end{scope} \begin{scope}[line width=1.5pt] \draw (P0) -- (P1); \draw (P1) -- (P2); \draw (P1) -- (P5); \draw (P2) -- (P3); \draw (P2) -- (P4); \draw (P5) -- (P6); \draw (P5) -- (P7); \draw (P5) -- (P8); \draw (P0) -- (P9); \end{scope} \end{tikzpicture} \end{center} \begin{corrige} On trouve les valeurs de Grundy suivantes en notant à côté de chaque nœud la valeur du sous-arbre enraciné en ce nœud : \begin{center} \begin{tikzpicture}[baseline=0] \fill [gray!50!white] (-1.5,0) rectangle (1.5,-0.2); \begin{scope}[every node/.style={circle,fill,inner sep=0.5mm}] \node (P0) at (0,0) {}; \node (P1) at (0,1) {}; \node (P2) at (-1.5,2) {}; \node (P3) at (-2.0,3) {}; \node (P4) at (-1.0,3) {}; \node (P5) at (1.5,2) {}; \node (P6) at (0.75,3) {}; \node (P7) at (1.5,3) {}; \node (P8) at (2.25,3) {}; \node (P9) at (1.75,1) {}; \end{scope} \begin{scope}[line width=1.5pt] \draw (P0) -- (P1); \draw (P1) -- (P2); \draw (P1) -- (P5); \draw (P2) -- (P3); \draw (P2) -- (P4); \draw (P5) -- (P6); \draw (P5) -- (P7); \draw (P5) -- (P8); \draw (P0) -- (P9); \end{scope} \node[anchor=east] at (P2) {$0$}; \node[anchor=west] at (P5) {$1$}; \node[anchor=east] at (P1) {$3$}; \node[anchor=east] at (P0) {$5$}; \end{tikzpicture} \end{center} La valeur de Grundy recherchée est donc $5$. En étudiant les différentes possibilités, on trouve qu'un coup gagnant possible consiste à retirer n'importe laquelle des arêtes les plus en haut sur le dessin (dans tous les cas, le sommet étiqueté $3$ sur la figure ci-dessus passe à $0$ et la racine de même). \end{corrige} \smallbreak (La question qui suit est indépendante des questions précédentes.) (6) On remarque que la construction $*{:}G$ définie avant la question (2) peut se définir de façon identique lorsque $G$ est un jeu partisan, en donnant à une arête $*{:}z\, \to \, *{:}z'$ la même couleur que $z\to z'$, et à une arête $*{:}z\, \to 0$ la couleur verte (ce qui signifie : à la fois bleue et rouge). En décrivant une stratégie, montrer que si $G \geq H$ on a aussi $*{:}G \geq *{:}H$, et en déduire que si $G\doteq H$ alors $*{:}G \doteq *{:}H$ (où $\doteq$ désigne l'égalité au sens de Conway des jeux partisans). \begin{corrige} Tout d'abord, observons que $-(*{:}G) = *{:}(-G)$ puisque la construction « $*{:}$ » est symétrique entre bleu et rouge. La condition $G\geq H$ signifie que le joueur bleu (Blaise) possède une stratégie gagnante au jeu $G-H = G+(-H)$ s'il joue en second. Montrons qu'il en possède encore une à $(*{:}G) - (*{:}H) = (*{:}G) + (*{:}(-H))$ en considérant comment il répond à un coup de son adversaire (Roxane). Si Roxane joue un coup de « destruction totale » sur l'une des composantes $(*{:}G)$ ou $(*{:}(-H))$, Blaise réplique sur l'autre et gagne. Si Roxane joue un coup dans une des deux composantes $G$ ou $-H$, Blaise répond selon la stratégie qu'il est supposé posséder. Dans tous les cas, Blaise peut répondre à tout coup de Roxane, donc il gagne. Ceci montre $*{:}G \geq *{:}H$. Comme $G\doteq H$ signifie $G\geq H$ et $G\leq H$, on a bien $*{:}G \geq *{:}H$ et $*{:}G \leq *{:}H$ d'après ce qu'on vient d evoir, c'est-à-dire $*{:}G \doteq *{:}H$. (La valeur d'un jeu partisan $*{:}G$ est donc déterminée par la valeur de $G$.) \end{corrige} % % % \exercice\label{normal-game-exercise} On considère le jeu en forme normale suivant : \emph{trois} joueurs (Alice, Bob et Charlie, par exemple) choisissent indépendamment les uns des autres un élément de l'ensemble $\{\mathtt{0},\mathtt{1}\}$ : \begin{itemize} \item s'ils ont tous les trois choisi la même option, ils gagnent tous $0$, \item si l'un d'entre eux a choisi une option différente des deux autres, celui qui a choisi cette option gagne $2$ et chacun des deux autres gagne $-1$. \end{itemize} Il sera utile de remarquer que les joueurs ont des rôles complètement symétriques, et que les options sont également symétriques. (Attention, même si la somme des gains des trois joueurs vaut toujours $0$, ce n'est pas un « jeu à somme nulle » au sens classique, car ces derniers ne sont définis que pour \emph{deux} joueurs.) \smallbreak (1) Écrire le tableau des gains du jeu considéré. (On choisira une façon raisonnable de présenter un tableau à trois entrées, par exemple comme plusieurs tableaux à deux entrées mis côte à côte.) \begin{corrige} On fait deux tableaux, l'un pour le cas où Alice joue $\mathtt{0}$, \begin{center} \begin{tabular}{r|cc} $\mathtt{0}$A, $\downarrow$B, C$\rightarrow$&$\mathtt{0}$&$\mathtt{1}$\\\hline $\mathtt{0}$&$0,0,0$&$-1,-1,+2$\\ $\mathtt{1}$&$-1,+2,-1$&$+2,-1,-1$\\ \end{tabular} \end{center} et l'autre pour le cas où Alice joue $\mathtt{1}$, \begin{center} \begin{tabular}{r|cc} $\mathtt{1}$A, $\downarrow$B, C$\rightarrow$&$\mathtt{0}$&$\mathtt{1}$\\\hline $\mathtt{0}$&$+2,-1,-1$&$-1,+2,-1$\\ $\mathtt{1}$&$-1,-1,+2$&$0,0,0$\\ \end{tabular} \end{center} Chacune des entrées doit bien sûr lister trois nombres, pour les gains d'Alice, Bob et Charlie respectivement. \end{corrige} \smallbreak Si $p \in [0;1]$, on notera simplement $p$ la stratégie mixte d'un joueur qui consiste à choisir l'option $\mathtt{1}$ avec probabilité $p$, et l'option $\mathtt{0}$ avec probabilité $1-p$. (2) Vérifier que l'espérance de gain d'Alice si elle joue selon la stratégie mixte $p$ tandis que Bob joue selon la stratégie mixte $q$ et Charlie selon la stratégie mixte $r$ vaut : $-2pq -2pr +4qr + 2p - q -r$. (Ici, $p,q,r$ sont trois réels entre $0$ et $1$.) \begin{corrige} Si Alice joue $\mathtt{0}$, son espérance de gain est $-q(1-r) - (1-q)r + 2qr$ d'après le premier tableau donné en réponse à la question précédente, soit $4qr - q - r$. Si Alice joue $\mathtt{1}$, son espérance de gain vaut $2(1-q)(1-r) -q(1-r) - (1-q)r = 4qr - 3q - 3r + 2$. Si elle joue $p$, son espérance de gain vaut $1-p$ fois $4qr - q - r$ plus $p$ fois $4qr - 3q - 3r + 2$, ce qui vaut l'expression $-2pq -2pr +4qr + 2p - q -r$ annoncée. \end{corrige} \smallbreak (3) On se demande à quelle condition sur la stratégie mixte $q$ jouée par Bob et la stratégie mixte $r$ jouée par Charlie les options $\mathtt{0}$ et $\mathtt{1}$ d'Alice sont indifférentes pour elle (c'est-à-dire, lui apportent la même espérance de gain). Montrer que c'est le cas si et seulement si $q + r = 1$. \begin{corrige} On cherche à quelle condition la valeur $4qr - q - r$ (qui se retrouve en substituant $0$ à $p$ dans $-2pq -2pr +4qr + 2p - q -r$) est égale à $4qr - 3q - 3r + 2$ (obtenue en mettant $p$ à $1$). La différence entre les deux vaut $2 - 2q - 2r$, qui est donc nulle si et seulement si $q+r = 1$, comme annoncé. \end{corrige} \smallbreak (4) Déduire de la question (3) que si un profil $(p,q,r)$ de stratégies mixtes est un équilibre de Nash et que $0