summaryrefslogtreecommitdiffstats
diff options
context:
space:
mode:
authorDavid A. Madore <david+git@madore.org>2022-02-19 11:15:44 +0100
committerDavid A. Madore <david+git@madore.org>2022-02-19 11:15:44 +0100
commit6696dadf0f16c9943d38d5b3c0ecadaebe669741 (patch)
tree3177d84714e2d134a46fe5cc934eb546b3931332
parent96e6a4283ad0043a0798f37af5d9dc220ce318fd (diff)
downloadmitro206-6696dadf0f16c9943d38d5b3c0ecadaebe669741.tar.gz
mitro206-6696dadf0f16c9943d38d5b3c0ecadaebe669741.tar.bz2
mitro206-6696dadf0f16c9943d38d5b3c0ecadaebe669741.zip
Rework the section on normal form games (convex sets and generalities).
-rw-r--r--notes-mitro206.tex233
1 files changed, 177 insertions, 56 deletions
diff --git a/notes-mitro206.tex b/notes-mitro206.tex
index fb055b0..c125348 100644
--- a/notes-mitro206.tex
+++ b/notes-mitro206.tex
@@ -1022,7 +1022,9 @@ surréels de Conway.
\section{Jeux en forme normale}\label{section-games-in-normal-form}
-\setcounter{comcnt}{0}
+\setcounter{subsection}{-1}
+
+\subsection{Rappels sur les convexes}
\thingy Pour cette section, on rappelle les définitions suivants : une
\index{affine (combinaison)|see{combinaison affine}}\defin{combinaison
@@ -1037,7 +1039,17 @@ $\lambda_1,\ldots,\lambda_m$ vérifient $\sum_{i=1}^m \lambda_i \neq
0$ : on parle alors de \defin{barycentre} de $x_1,\ldots,x_m$ affecté
des coefficients $\lambda_1,\ldots,\lambda_m$).
-Une \index{convexe (combinaison)|see{combinaison
+Lorsque $x_1,\ldots,x_m$ sont tels que la combinaison affine est
+déterminée par ses coefficients, autrement dit lorsque l'application
+$(\lambda_1,\ldots,\lambda_m) \mapsto \sum_{i=1}^m \lambda_i x_i$
+définie sur l'ensmble des $(\lambda_1,\ldots,\lambda_m)$ tels que
+$\sum_{i=1}^m \lambda_i = 1$, est injective, on dit que
+$x_1,\ldots,x_m$ sont \index{affinement indépendants
+ (points)}\defin{affinement indépendants} (ou affinement libres). Il
+revient au même de dire que $x_2-x_1,\ldots,x_m-x_1$ sont linéairement
+indépendants.
+
+\thingy Une \index{convexe (combinaison)|see{combinaison
convexe}}\defin{combinaison convexe} est une combinaison affine
$\sum_{i=1}^m \lambda_i x_i$ où $\lambda_1,\ldots,\lambda_m$ sont
\emph{positifs} ($\lambda_1,\ldots,\lambda_m \geq 0$) et vérifient
@@ -1048,16 +1060,86 @@ Un \defin{convexe} de $\mathbb{R}^m$ est une partie stable par
combinaisons convexes (c'est-à-dire que $C$ est dit convexe lorsque si
$x_1,\ldots,x_m \in C$ et $\lambda_1,\ldots\lambda_m\geq 0$ vérifient
$\sum_{i=1}^m \lambda_i = 1$ alors $\sum_{i=1}^m \lambda_i x_i \in
-C$).
-
-Une \index{affine (application)}\textbf{application affine} $u\colon
-\mathbb{R}^p \to \mathbb{R}^q$ est une fonction qui préserve les
-combinaisons affines (autrement dit, si $\sum_{i=1}^m \lambda_i = 1$
-alors $u\Big(\sum_{i=1}^m \lambda_i x_i\Big) = \sum_{i=1}^m \lambda_i
-u(x_i)$). Il revient au même de dire que $u$ est la somme d'une
-constante (dans $\mathbb{R}^q$) et d'une application linéaire
+C$). Par associativité du barycentre, il revient au même d'imposer
+cette condition pour $m=2$, c'est-à-dire que $C \subseteq
+\mathbb{R}^m$ est convexe ssi on a $[x,y] \subseteq C$ pour tous
+$x,y\in C$, où $[x,y] := \{\lambda x + (1-\lambda) y : \lambda \in
+[0;1]\}$.
+
+Une intersection quelconque de convexes étant manifestement un
+convexe, on peut parler du plus petit convexe contenant une partie $A
+\subseteq \mathbb{R}^m$, appelé \index{convexe
+ (enveloppe)|see{enveloppe convexe}}\defin{enveloppe convexe}
+de $A$ : il s'agit simplement de l'ensemble de toutes les combinaisons
+convexes des points de $A$ (i.e., des ensembles \emph{finis} de points
+de $A$). L'enveloppe convexe d'une partie finie s'appelle un
+\defin{polytope} (convexe). L'enveloppe convexe d'une partie $A$
+affinement libre et finie\footnote{Une partie affinement libre de
+ $\mathbb{R}^m$ a au plus $m+1$ points, donc le mot « fini » est
+ redondant dans ce cadre, mais la définition peut s'étendre en
+ dimension infinie auquel cas il n'est plus inutile.} s'appelle
+\defin{simplexe} de sommets $A$.
+
+\thingy Une \index{affine (application)}\textbf{application affine}
+$u\colon \mathbb{R}^p \to \mathbb{R}^q$ est une fonction qui préserve
+les combinaisons affines (autrement dit, si $\sum_{i=1}^m \lambda_i =
+1$ alors $u\Big(\sum_{i=1}^m \lambda_i x_i\Big) = \sum_{i=1}^m
+\lambda_i u(x_i)$). Il revient au même de dire que $u$ est la somme
+d'une constante (dans $\mathbb{R}^q$) et d'une application linéaire
$\mathbb{R}^p \to \mathbb{R}^q$.
+On aura fréquemment besoin du fait évident suivant :
+\begin{prop}\label{affine-functions-take-extrema-at-boundary}
+Soit $A \subseteq \mathbb{R}^m$ un ensemble fini et $C$ son enveloppe
+convexe, et soit $u \colon \mathbb{R}^m \to \mathbb{R}$ une
+application affine. Alors $u(a) \leq M$ pour tout $a \in A$ implique
+$u(s) \leq M$ pour tout $s \in C$. Ou, si on préfère, $\max\{u(s) :
+s\in C\}$ existe et vaut $\max\{u(a) : a\in A\}$ (et la même
+affirmation en remplaçant $\max$ par $\min$ vaut aussi).
+\end{prop}
+
+En français : « une fonction affine sur un polytope atteint ses bornes
+sur un sommet de ce dernier ».
+
+\begin{proof}
+Tout point $s$ de $C$ est combinaison convexe de points de $A$,
+c'est-à-dire $s = \sum_{i=1}^n \lambda_i x_i$ avec $x_i \in A$ et
+$\lambda_i \geq 0$ vérifiant $\sum_{i=1}^n \lambda_i = 1$. Comme $u$
+est affine, on a alors $u(s) = \sum_{i=1}^n \lambda_i u(x_i)$. Si
+$u(a) \leq M$ pour tout $a\in A$, ceci implique $u(s) \leq
+\sum_{i=1}^n \lambda_i M = M$, comme annoncé.
+
+Pour en déduire l'affirmation sur le $\max$, il suffit d'appliquer ce
+qu'on vient de démontrer pour $M = \max\{u(a) : a\in A\}$ (qui existe
+puisque $A$ est fini) : on a $u(s) \leq M$ pour tout $s \in C$, et
+comme les éléments de $A$ sont dans $C$, ceci montre bien $\max\{u(s)
+: s\in C\} = \max\{u(a) : a\in A\}$.
+\end{proof}
+
+\begin{prop}\label{affine-functions-take-no-strict-extrema-inside}
+Reprenons le contexte de la proposition précédente ($A \subseteq
+\mathbb{R}^m$ un ensemble fini, $C$ son enveloppe convexe, et $u
+\colon \mathbb{R}^m \to \mathbb{R}$ affine), et soit $M := \max_{a \in
+ A} u$ (dont on vient de voir que c'est aussi $\max_{s\in C} u$) : si
+une combinaison convexe $s$ à coefficients \emph{strictement positifs}
+de points de $A$ (i.e., $s = \sum_{i=1}^n \lambda_i x_i$ avec $x_i \in
+A$ et $\lambda_i > 0$ vérifiant $\sum_{i=1}^n \lambda_i = 1$) vérifie
+$u(s) = M$, alors chacun des points en question vérifie aussi cette
+propriété (i.e., on a $u(x_i) = M$ pour tout $i$).
+\end{prop}
+
+\begin{proof}
+Si on a $u(x_j) < M$ pour un certain $j$, alors on a $\lambda_j u(x_j)
+< \lambda_j M$, donc en sommant avec les autres $\lambda_i u(x_i) \leq
+\lambda_i M$ on trouve $u(s) = \sum_{i=1}^n \lambda_i u(x_i) <
+\sum_{i=1}^n \lambda_i M = M$.
+\end{proof}
+
+On peut aussi reformuler ce résultat en affirmant que la partie de $C$
+où $u$ prend sa valeur maximale $M$ est l'enveloppe convexe de la
+partie de $A$ où elle prend cette valeur.
+
+
\subsection{Généralités}
\begin{defn}\label{definition-game-in-normal-form}
@@ -1086,36 +1168,49 @@ fait que les joueurs peuvent également jouer de façon probabiliste, ce
qui amène à introduire la notion de stratégie mixte :
\begin{defn}\label{definition-mixed-strategy-abst}
-Donné un ensemble $B$ fini d'« options », on appelle \index{mixte (stratégie)}\defin{stratégie
- mixte} sur $B$ une fonction $s\colon B\to\mathbb{R}$ telle que
-$s(b)\geq 0$ pour tout $b\in B$ et $\sum_{b\in B} s(b) = 1$ :
-autrement dit, il s'agit d'une distribution de probabilités sur $B$.
-
-Le \defin[support (d'une stratégie mixte)]{support} de $s$ est l'ensemble des options $b\in B$ pour
-lesquelles $s(b) > 0$.
-
-Parfois, on préférera considérer la stratégie comme la combinaison
-formelle $\sum_{b\in B} s(b)\cdot b$ (« formelle » signifiant que le
-produit $t\cdot b$ utilisé ici n'a pas de sens intrinsèque : il est
-défini par son écriture ; l'écriture $\sum_{b\in B} s(b)\cdot b$ est
-donc une simple notation pour $s$). Autrement dit, ceci correspond à
-voir une stratégie mixte comme une combinaison convexe d'éléments
-de $B$, i.e., un point du simplexe affine dont les sommets sont les
-éléments de $B$. En particulier, un élément $b$ de $B$ (stratégie
-pure) sera identifié à l'élément de $S_B$ qui affecte le poids $1$
-à $b$ et $0$ à tout autre élément.
+Donné un ensemble $B$ fini d'« options », on appelle \index{mixte
+ (stratégie)}\defin{stratégie mixte} sur $B$ une fonction $s\colon
+B\to\mathbb{R}$ telle que $s(b)\geq 0$ pour tout $b\in B$ et
+$\sum_{b\in B} s(b) = 1$ : autrement dit, il s'agit d'une distribution
+de probabilités sur $B$.
+
+Le \defin[support (d'une stratégie mixte)]{support} de $s$ est
+l'ensemble des options $b\in B$ pour lesquelles $s(b) > 0$.
+\end{defn}
+
+On identifiera un élément $b$ de $B$ à la fonction (stratégie pure)
+$\delta_b \colon B\to\mathbb{R}$ qui prend la valeur $1$ en $b$ et $0$
+ailleurs (distribution de probabilités de Dirac en $b$). Ceci permet
+d'identifier une stratégie mixte $s\colon B\to\mathbb{R}$ quelconque
+sur $B$ à la combinaison convexe $\sum_{b\in B} s(b)\cdot b$ des
+stratégies pures : i.e., on peut considérer les stratégies mixtes
+comme des combinaison convexes formelles\footnote{Le mot « formel »
+ signifie ici que la combinaison n'a pas d'autre sens que comme
+ l'expression par laquelle elle est définie, par exemple
+ $\frac{1}{3}\text{Pierre} + \frac{1}{3}\text{Papier} +
+ \frac{1}{3}\text{Ciseaux}$ est une combinaison convexe formelle de
+ $\{\text{Pierre}, \text{Papier}, \text{Ciseaux}\}$ représentant la
+ probabilité uniforme sur cet ensemble.} des éléments de $B$.
+
+On passera indifféremment entre ces trois points de vue sur les
+stratégies mixtes : fonctions $s\colon B\to\mathbb{R}$, mesures de
+probabilités sur $B$, ou bien combinaisons convexes formelles
+d'éléments de $B$.
En tout état de cause, l'ensemble $S_B$ des stratégies mixtes sur $B$
-sera vu (notamment comme espace topologique) comme le fermé de
-$\mathbb{R}^B$ défini par l'intersection des demi-espaces de
-coordonnées positives et de l'hyperplan défini par la somme des
-coordonnées égale à $1$.
-\end{defn}
+sera vu comme la partie de $\mathbb{R}^B$ définie par l'intersection
+des demi-espaces de coordonnées positives et de l'hyperplan défini par
+la somme des coordonnées égale à $1$ : il s'agit d'un \emph{convexe
+ fermé}, qui est l'enveloppe convexe des points de $B$ identifiés
+ainsi qu'on vient de le dire aux $\delta_b =
+(0,\ldots,0,1,0,\ldots,0)$, c'est-à-dire que $S_B$ est le
+\defin{simplexe} d'ensemble de sommets $B$.
\begin{defn}\label{definition-mixed-strategy-game}
Pour un jeu comme défini en \ref{definition-game-in-normal-form}, une
stratégie mixte pour le joueur $i$ est donc une fonction $s\colon A_i
-\to\mathbb{R}$ comme on vient de le dire. On notera parfois $S_i$
+\to\mathbb{R}$ comme on vient de le dire
+en \ref{definition-mixed-strategy-abst}. On notera parfois $S_i$
l'ensemble des stratégies mixtes du joueur $i$. Un \defin{profil de
stratégies mixtes} est un élément du produit cartésien $S := S_1
\times \cdots \times S_N$.
@@ -1131,25 +1226,46 @@ parler de profil de stratégies pures.
\end{defn}
\thingy\label{remark-mixed-stragy-profile-versus-correlated-profile}
-Il va de soi qu'un profil de stratégies mixtes, i.e., un
-élément de $S := S_1 \times \cdots \times S_N$, i.e., la donnée d'une
-distribution de probabilité sur chaque $A_i$, n'est pas la même chose
-qu'une distribution de probabilités sur $A := A_1 \times \cdots \times
-A_N$. Néanmoins, on peut voir les profils de stratégies mixtes comme
-des distributions particulières sur $A$, à savoir celles pour
-lesquelles les marginales (i.e., les projections sur un des $A_i$)
-sont indépendantes. Concrètement, ceci signifie que donné
-$(s_1,\ldots,s_N) \in S$, on en déduit un $s\colon A\to\mathbb{R}$,
-aussi une distribution de probabilité, par la définition suivante :
-$s(a_1,\ldots,a_N) = s_1(a_1)\cdots s_N(a_N)$ (produit des
-$s_i(a_i)$). On identifiera parfois abusivement l'élément
-$(s_1,\ldots,s_N) \in S$ à la distribution $s\colon A\to\mathbb{R}$
-qu'on vient de décrire (ce n'est pas un problème car $s_i$ se déduit
-de $s$ : précisément, $s_i(b) = \sum_{a\,:\, a_i = b} s(a)$ où la somme
-est prise sur les $a \in A$ tels que $a_i = b$).
-
-\danger (Il faudra prendre garde au fait qu'on peut voir $S$ soit
-comme une partie $S_1\times\cdots\times S_N$ de
+Il va de soi qu'un profil de stratégies mixtes, i.e., un élément de $S
+:= S_1 \times \cdots \times S_N$, i.e., la donnée d'une distribution
+de probabilité sur chaque $A_i$, \emph{n'est pas la même chose} qu'une
+distribution de probabilités sur $A := A_1 \times \cdots \times A_N$.
+
+Néanmoins, si $(s_1,\ldots,s_N) \in S$, on définit une distribution de
+probabilités $s\colon A\to\mathbb{R}$ (un élément de $S_A$, si on
+veut) de la façon suivante :
+\[
+s(a_1,\ldots,a_N) = s_1(a_1)\cdots s_N(a_N)
+\tag{$*$}
+\]
+(produit des $s_i(a_i)$).
+
+Probabilistiquement, cette formule revient à dire qu'on tire un
+élément $a_i$ de $A_i$ selon la distribution $s_i$ \emph{de façon
+ indépendante} pour chaque $i$ de manière à former un $N$-uplet
+$(a_1,\ldots,a_N)$. La formule ($*$) servira donc à représenter
+l'hypothèse que les joueurs ont accès à des sources de hasard qui sont
+indépendantes (si Alice tire son coup à pile ou face et que Bob fait
+de même, les pièces tirées par Alice et Bob sont des variables
+aléatoires indépendantes). Les distributions de probabilités $s$
+sur $A$ définies par la formule ($*$) sont précisément celles dont
+composantes sont indépendantes, et qui sont alors complètement
+déterminées par leurs
+\emph{marginales}\footnote{\label{footnote-marginals}La $i$-ième
+ marginale d'une distribution de probabilités $s \colon A \to
+ \mathbb{R}$ est la distribution de probabilités $s_i \colon A_i \to
+ \mathbb{R}$ qui à $b\in A_i$ associe la somme des
+ $s(a_1,\ldots,a_N)$ prise sur tous les $N$-uplets $(a_1,\ldots,a_N)$
+ tels que $a_i = b$.} $s_1,\ldots,s_N$.
+
+On identifiera parfois abusivement l'élément $(s_1,\ldots,s_N) \in S$
+à la distribution $s\colon A\to\mathbb{R}$ qu'on vient de décrire (ce
+n'est pas un problème car $s_i$ se déduit de $s$ : précisément,
+$s_i(b) = \sum_{a\,:\, a_i = b} s(a)$ où la somme est prise sur les $a
+\in A$ tels que $a_i = b$, cf. note \ref{footnote-marginals}).
+
+\danger Il faudra prendre garde au fait que, du coup, $S$ peut se voir
+soit comme la partie $S_1\times\cdots\times S_N$ de
$\mathbb{R}^{A_1}\times\cdots\times \mathbb{R}^{A_N}$ formé des
$N$-uplets $(s_1,\ldots,s_N)$, soit comme la partie de $\mathbb{R}^A =
\mathbb{R}^{A_1\times\cdots\times A_N}$ formé des fonctions de la
@@ -1158,7 +1274,8 @@ l'a expliqué au paragraphe précédent. Ces deux points de vue ont un
sens et ont parfois un intérêt, mais ils ne partagent pas les mêmes
propriétés. Par exemple, $S$ est convexe en tant que partie
$S_1\times\cdots\times S_N$ de $\mathbb{R}^{A_1}\times\cdots\times
-\mathbb{R}^{A_N}$, mais pas en tant que partie de $\mathbb{R}^A$.)
+\mathbb{R}^{A_N}$, mais pas en tant que partie de $\mathbb{R}^A$.
+Néanmoins, ce double point de vue ne devrait pas causer de confusion.
Ceci conduit à faire la définition suivante :
@@ -1171,8 +1288,12 @@ quantité
\[
u_i(s) := \sum_{a\in A} s_1(a_1)\cdots s_N(a_N)\,u_i(a)
\]
-(ceci définit $u_i$ comme fonction de $S_1\times\cdots \times S_N$
-vers $\mathbb{R}$).
+c'est-à-dire selon la distribution de probabilités définie par la
+formule ($*$)
+de \ref{remark-mixed-stragy-profile-versus-correlated-profile}. Ceci
+étend $u_i$ en une function de $S := S_1\times\cdots \times S_N$
+vers $\mathbb{R}$, qu'on dénotera par le même symbole car il n'en
+résultera pas de confusion.
\end{defn}
Selon l'approche qu'on veut avoir, on peut dire qu'on a défini