From c0aec3835f1dc9068188044f905202e378432ca5 Mon Sep 17 00:00:00 2001
From: "David A. Madore" <david+git@madore.org>
Date: Mon, 6 Nov 2017 15:21:34 +0100
Subject: A brief description of the CYK dynamic programming algorithm for
 CFGs.

---
 notes-inf105.tex | 115 +++++++++++++++++++++++++++++++++++++++++++++++++++----
 1 file changed, 107 insertions(+), 8 deletions(-)

(limited to 'notes-inf105.tex')

diff --git a/notes-inf105.tex b/notes-inf105.tex
index 60877a5..e08083d 100644
--- a/notes-inf105.tex
+++ b/notes-inf105.tex
@@ -4739,11 +4739,13 @@ VV'|\varepsilon$).  Nous éviterons ces extensions aux grammaires hors
 contexte pour ne pas introduire de confusion.
 \par}
 
-\thingy Il peut être utile, pour raisonner sur les langages
-algébriques, d'introduire, lorsque $G$ est une grammaire hors contexte
-et $T$ un nonterminal quelconque, le langage $L(G,T)$ des mots qui
-dérivent de $T$, c'est-à-dire le langage engendré par la grammaire
-$G'$ identique à $G$ à ceci près que son axiome est $T$.
+\thingy\label{words-deriving-from-another-nonterminal} Il peut être
+utile, pour raisonner sur les langages algébriques, d'introduire,
+lorsque $G$ est une grammaire hors contexte et $T$ un nonterminal
+quelconque, le langage $L(G,T) := \{w \in \Sigma^* : T
+\mathrel{\Rightarrow^*_G} w\}$ des mots qui dérivent de $T$,
+c'est-à-dire le langage engendré par la grammaire $G'$ identique à $G$
+à ceci près que son axiome est $T$.
 
 {\footnotesize
 On a alors $L(G) = L(G,S)$ où $S$ est l'axiome de $G$, et chaque règle
@@ -5386,7 +5388,7 @@ en \ref{example-of-pumping-lemma-for-algebraic-languages} qu'il n'est
 pas algébrique ; c'est donc que $L$ n'est pas non plus algébrique.
 
 
-\subsection{Notions sur l'analyse des langages hors contexte}
+\subsection{Notions sur l'analyse algorithmique des langages hors contexte}
 
 \thingy Il est naturel de se poser la question suivante : existe-t-il
 un algorithme qui, donnée une grammaire hors contexte $G$, permet de
@@ -5461,8 +5463,8 @@ non déterministes.
 
 \thingy Une approche simple, quoique terriblement inefficace, pour
 résoudre algorithmiquement, \emph{en théorie}, le problème de décider
-si un mot $w$ appartient au langage $L(G)$ engendré par une
-grammaire $G$ est la suivante :
+si un mot $w$ appartient au langage $L(G)$ engendré par une grammaire
+hors contexte $G$ (absolument quelconque) est la suivante :
 \begin{itemize}
 \item réécrire la grammaire (i.e., la remplacer par une grammaire
   équivalente) de manière à ce que le membre de droite de chaque
@@ -5549,6 +5551,103 @@ pseudo-mots de longueur $>|w|$), donc on peut détecter sur ce graphe
 fini si une telle dérivation existe.
 \end{proof}
 
+{\footnotesize
+
+\thingy\label{handwaving-on-dynamical-programming} Expliquons comment
+on peut approcher de façon algorithmiquement plus efficace le problème
+de reconnaître si $w \in L(G)$, et fournir une autre démonstration du
+théorème \ref{algebraic-languages-are-decidable}, tout en continuant à
+ne faire aucune hypothèse sur la grammaire hors contexte $G$.
+
+Il s'agit de travailler en deux étapes :
+\begin{itemize}
+\item D'abord, trouver algorithmiquement une grammaire $G'$ et un $E
+  \subseteq \{\varepsilon\}$ tels que $L(G) = L(G') \cup E$, et que
+  $G'$ soit en \defin[Chomsky (forme normale de)]{forme normale de
+    Chomsky}, c'est-à-dire que toute production de $G'$ est de la
+  forme $T \rightarrow UV$ avec $U,V$ (exactement) deux nonterminaux,
+  ou bien $T \rightarrow x$ avec $x$ un terminal.
+\item Ensuite, utiliser un algorithme de programmation dynamique pour
+  calculer, pour chaque facteur $u$ de $w$ (par ordre croissant de
+  taille), l'ensemble de tous les terminaux $T$ tels que $T
+  \mathrel{\Rightarrow^*} u$.
+\end{itemize}
+
+Détaillons un peu plus chacune de ces étapes.
+
+Pour transformer la grammaire $G$ en une grammaire $G'$ sous forme
+normale de Chomsky, on effectue les transformations suivantes :
+\begin{itemize}
+\item Introduire pour chaque terminal $x$ un nonterminal $X$ et une
+  règle $X \rightarrow x$, et remplacer chaque occurrence de $x$
+  par $X$ dans le membre de droite de toute règle autre que $X
+  \rightarrow x$.  Ceci permet de faire en sorte qu'à part les règles
+  $X \rightarrow x$, le membre de droite de toute règle soit
+  uniquement constitué de nonterminaux.
+\item Pour chaque règle $T \rightarrow U_1 \cdots U_n$ dont le membre
+  de droite est de longueur $n\geq 3$, introduire $n-2$ nouveaux
+  nonterminaux $Z_1,\ldots, Z_{n-2}$ et remplacer la règle $T
+  \rightarrow U_1 \cdots U_n$ par les $n-1$ règles $T \rightarrow U_1
+  Z_1$ et $Z_i \rightarrow U_{i+1} Z_{i+1}$ pour $1\leq i\leq n-3$ et
+  $Z_{n-2} \rightarrow U_{n-1} U_n$.  Ceci permet de faire en sorte
+  que le membre de droite de chaque règle soit de longueur $\leq 2$.
+\item Éliminer les règles produisant $\varepsilon$ (et calculer
+  l'ensemble $E$) exactement comme dans la démonstration du premier
+  point de \ref{algebraic-languages-are-decidable}.  À ce stade-là, le
+  membre de droite de chaque règle est de longueur exactement
+  $1$ ou $2$ (et dans le second cas, constitué de deux nonterminaux).
+\item Pour chaque règle $U \rightarrow \alpha$ où $\alpha$ n'est pas
+  un unique nonterminal, et chaque terminal tel qu'il existe une suite
+  $T \rightarrow \cdots \rightarrow V$ de règles produisant à chaque
+  fois un unique nonterminal, et réécrivant $T$ en $V$, introduire une
+  règle $T \rightarrow \alpha$, puis supprimer toutes les règles dont
+  le membre de droite est un unique nonterminal.  (Cette
+  transformation fonctionne exactement comme l'élimination des
+  ε-transitions d'un εNFA, cf. \ref{removal-of-epsilon-transitions},
+  si on imagine que les règles de la forme $T \rightarrow U$ sont des
+  sortes de transitions spontanées d'un nonterminal vers un autre.)
+\end{itemize}
+
+L'ordre de ces transformations peut être légèrement varié, mais
+l'ordre proposé ci-dessus est sans doute le meilleur.
+
+Une fois la grammaire $G'$ en forme normale de Chomsky connue,
+lorsqu'on a un mot $w$ dont on cherche à tester s'il appartient
+à $L(G')$, on calcule, pour chaque facteur $u$ de $w$ (identifié par
+son point de départ et sa longueur), dans l'ordre croissant de
+longueur, l'ensemble $\Lambda(u)$ des nonterminaux $T$ tels que $u \in
+L(G',T)$ (on rappelle,
+cf. \ref{words-deriving-from-another-nonterminal}, que $L(G',T) :=
+\{w \in \Sigma^* : T \mathrel{\Rightarrow^*} w\}$) :
+\begin{itemize}
+\item Si $|u|=1$, c'est-à-dire $u \in \Sigma$, il s'agit simplement de
+  l'ensemble des $T$ tels que la règle $T \rightarrow u$ soit
+  dans $G'$.
+\item Si $|u|\geq 2$, considérer chaque factorisation $u = v_1 v_2$ en
+  facteurs de taille $\geq 1$ (il y en a $|u|-1$ possibles), pour
+  chacune d'entre elles, pour chaque $X_1 \in \Lambda(v_1)$ (i.e., tel
+  que $v_1 \in L(G',X_1)$) et chaque $X_2 \in \Lambda(v_2)$ (i.e., tel
+  que $v_2 \in L(G',X_2)$) (ces deux ensembles étant connus par
+  récurrence), et chaque $Y$ tel que la règle $Y \rightarrow X_1 X_2$
+  soit dans $G'$, mettre l'élément $Y$ dans $\Lambda(u)$.
+\end{itemize}
+
+Il n'est pas difficile de se convaincre que ceci construit bien les
+ensembles $\Lambda(u)$ annoncés : la deuxième partie revient à
+rechercher toutes les dérivations $Y \Rightarrow X_1 X_2
+\mathrel{\Rightarrow^*} v_1 v_2 = u$ possibles dans lesquelles $X_1$ a
+donné $v_1$ et $X_2$ a donné $v_2$.  Une fois les $\Lambda(u)$ connus,
+tester si $w \in L(G')$ revient à tester si $S \in \Lambda(w)$.
+
+L'algorithme qu'on vient de décrire (pour tester si $w \in L(G')$ une
+fois $G'$ sous forme normale de Chomsky) porte le nom
+d'\defin[Cocke-Younger-Kasami (algorithme de)]{algorithme de
+  Cocke–Younger–Kasami} ou algorithme \index{CYK (algorithme
+  de)|see{Cocke-Younger-Kasami}}\textbf{CYK}.  Sa complexitée est
+cubique en la longueur de $w$.
+
+\par}
+
 \thingy\label{handwaving-on-ll-and-lr} Du point de vue pratique, il existe deux approches principales
 pour analyser les langages définis par des grammaires hors contexte
 (supposées \emph{au minimum} inambiguës) :
-- 
cgit v1.2.3