From 6adeb9190e730a5ae8ba39675306031619c648fe Mon Sep 17 00:00:00 2001 From: "David A. Madore" Date: Tue, 21 Feb 2017 15:01:03 +0100 Subject: Various clarifications / improvements on normal form games. --- notes-mitro206.tex | 134 ++++++++++++++++++++++++++++++++++++++++------------- 1 file changed, 102 insertions(+), 32 deletions(-) diff --git a/notes-mitro206.tex b/notes-mitro206.tex index d648151..96dfe79 100644 --- a/notes-mitro206.tex +++ b/notes-mitro206.tex @@ -1145,6 +1145,18 @@ qu'on vient de décrire (ce n'est pas un problème car $s_i$ se déduit de $s$ : précisément, $s_i(b) = \sum_{a: a_i = b} s(a)$ où la somme est prise sur les $a \in A$ tels que $a_i = b$). +\danger (Il faudra prendre garde au fait qu'on peut voir $S$ soit +comme une partie $S_1\times\cdots\times S_N$ de +$\mathbb{R}^{A_1}\times\cdots\times \mathbb{R}^{A_N}$ formé des +$N$-uplets $(s_1,\ldots,s_N)$, soit comme la partie de $\mathbb{R}^A = +\mathbb{R}^{A_1\times\cdots\times A_N}$ formé des fonctions de la +forme $s\colon (a_1,\ldots,a_N) = s_1(a_1)\cdots s_N(a_N)$ comme on +l'a expliqué au paragraphe précédent. Ces deux points de vue ont un +sens et ont parfois un intérêt, mais ils ne partagent pas les mêmes +propriétés. Par exemple, $S$ est convexe en tant que partie +$S_1\times\cdots\times S_N$ de $\mathbb{R}^{A_1}\times\cdots\times +\mathbb{R}^{A_N}$, mais pas en tant que partie de $\mathbb{R}^A$.) + Ceci conduit à faire la définition suivante : \begin{defn} @@ -1177,12 +1189,13 @@ $s_? := (s_1,\ldots,s_{i-1},s_{i+1},\ldots,s_N) \in S_1 \times \cdots \times S_{i-1} \times S_{i+1} \times \cdots \times S_N$ est un profil de stratégies mixtes pour tous les joueurs autres que le joueur $i$, on dit que la stratégie mixte $s_! \in S_i$ est une \defin{meilleure - réponse} (resp. la meilleure réponse stricte) contre $s_?$ lorsque -pour tout $t \in S_i$ on a $u_i(s_?,s_!) \geq u_i(s_?,t)$ + réponse} (resp. la meilleure réponse \textbf{stricte}) contre $s_?$ +lorsque pour tout $t \in S_i$ on a $u_i(s_?,s_!) \geq u_i(s_?,t)$ (resp. lorsque pour tout $t \in S_i$ différent de $s_!$ on a $u_i(s_?,s_!) > u_i(s_?,t)$), où $(s_?,t)$ désigne l'élément de $S_1\times \cdots \times S_N$ obtenu en insérant $t \in S_i$ comme -$i$-ième composante entre $s_{i-1}$ et $s_{i+1}$. +$i$-ième composante entre $s_{i-1}$ et $s_{i+1}$, c'est-à-dire le gain +[espéré] obtenu en jouant $t$ contre $s_?$. Un profil de stratégies mixtes $s = (s_1,\ldots,s_N)$ (pour l'ensemble des joueurs) est dit être un \index{Nash (équilibre de)}\defin{équilibre de Nash} (resp., un @@ -1197,24 +1210,36 @@ Donné un jeu en forme normale comme en \ref{definition-game-in-normal-form}, si $1 \leq i \leq N$ et si $s_?$ est un profil de stratégies mixtes pour tous les joueurs autres que le joueur $i$, il existe une meilleure réponse pour le joueur $i$ -qui est une stratégie pure. Et même, si $s_!$ (stratégie mixte) est -une meilleure réponse, alors il existe une meilleure réponse qui est -une stratégie pure appartenant au support de $s_!$. +qui est une stratégie pure. De plus, si $s_!$ (stratégie mixte) est +une meilleure réponse contre $s_?$ si et seulement si \emph{chaque} +stratégie pure appartenant au support de $s_!$ est une meilleure +réponse possible contre $s_?$ (et elles apportent toutes le même +gain). En particulier, une meilleure réponse stricte est nécessairement une stratégie pure. \end{prop} \begin{proof} -Il suffit de se rappeler que $u_i(s_?,t)$ est une fonction affine -de $t \in S_i$, c'est-à-dire que sa valeur est combinaison convexe, à -coefficients les $t(a)$ pour $a\in S_i$, des $u_i(s_?,a)$. Comme une -combinaison convexe est majorée par la plus grande des valeurs -combinée (ici, des $u_i(s_?,a)$), il est clair que le maximum des -$u_i(s_?,t)$ existe et est égal au maximum des $u_i(s_?,a)$ ; les -autres affirmations sont tout aussi faciles. - -(Si on préfère : une fonction affine sur un simplexe prend son maximum -— ou son minimum — sur un des sommets de ce simplexe.) +Tout ceci résulte du fait que le gain espéré $u_i(s_?,t)$ est une +fonction affine de $t \in S_i$ (et une fonction affine sur un simplexe +prend son maximum — ou son minimum — sur un des sommets de ce +simplexe, et ne peut le prendre à l'intérieur que si elle prend aussi +cette valeur sur les sommets). + +Plus précisément : $u_i(s_?,t)$ (pour $t \in S_i$) est combinaison +convexe avec pour coefficients $t(a)$ pour $a\in A_i$, des +$u_i(s_?,a)$. Si $v$ est le maximum des $u_i(s_?,a)$ (qui sont en +nombre fini donc ce maximum existe), alors $v$ est aussi le maximum de +toute combinaison convexe $u_i(s_?,t)$ des $u_i(s_?,a)$ : c'est-à-dire +que $t\in S_i$ est une meilleure réponse possible contre $s_?$ si et +seulement si $u_i(s_?,t) = v$. En particulier, tout $a \in A_i$ qui +réalise ce maximum $v$ est une meilleure réponse possible +(contre $s_?$) qui est une stratégie pure. D'autre part, une +combinaison convexe $u_i(s_?,t)$ de valeurs $\leq v$ ne peut être +égale à $v$ que si toutes les valeurs $u_i(s_?,a)$ entrant +effectivement (c'est-à-dire avec un coefficient $>0$) dans la +combinaison sont égales à $v$ (s'il y en avait une $