%% This is a LaTeX document. Hey, Emacs, -*- latex -*- , get it? \documentclass[12pt,a4paper]{article} \usepackage[francais]{babel} \usepackage[utf8]{inputenc} \usepackage[T1]{fontenc} %\usepackage{ucs} \usepackage{times} % A tribute to the worthy AMS: \usepackage{amsmath} \usepackage{amsfonts} \usepackage{amssymb} \usepackage{amsthm} % \usepackage{mathrsfs} \usepackage{wasysym} \usepackage{url} % \usepackage{graphics} \usepackage[usenames,dvipsnames]{xcolor} \usepackage{tikz} \usetikzlibrary{arrows,automata,positioning} \usepackage{hyperref} % \theoremstyle{definition} \newtheorem{comcnt}{Tout} \newcommand\thingy{% \refstepcounter{comcnt}\smallbreak\noindent\textbf{\thecomcnt.} } \newcommand\exercice{% \refstepcounter{comcnt}\bigbreak\noindent\textbf{Exercice~\thecomcnt.}} \renewcommand{\qedsymbol}{\smiley} % \DeclareUnicodeCharacter{00A0}{~} \DeclareUnicodeCharacter{03B5}{$\varepsilon$} % \DeclareMathSymbol{\tiret}{\mathord}{operators}{"7C} \DeclareMathSymbol{\traitdunion}{\mathord}{operators}{"2D} % % \DeclareFontFamily{U}{manual}{} \DeclareFontShape{U}{manual}{m}{n}{ <-> manfnt }{} \newcommand{\manfntsymbol}[1]{% {\fontencoding{U}\fontfamily{manual}\selectfont\symbol{#1}}} \newcommand{\dbend}{\manfntsymbol{127}}% Z-shaped \newcommand{\danger}{\noindent\hangindent\parindent\hangafter=-2% \hbox to0pt{\hskip-\hangindent\dbend\hfill}} % \newcommand{\spaceout}{\hskip1emplus2emminus.5em} \newif\ifcorrige \corrigetrue \newenvironment{corrige}% {\ifcorrige\relax\else\setbox0=\vbox\bgroup\fi% \smallbreak\noindent{\underbar{\textit{Corrigé.}}\quad}} {{\hbox{}\nobreak\hfill\checkmark}% \ifcorrige\relax\else\egroup\fi\par} \newenvironment{commentaire}% {\ifcorrige\relax\else\setbox0=\vbox\bgroup\fi% \smallbreak\noindent{\underbar{\textit{Commentaires.}}\quad}} {{\hbox{}\nobreak\hfill\maltese}% \ifcorrige\relax\else\egroup\fi\par} % % % NOTE: compile dot files with % dot2tex --figonly -f tikz --tikzedgelabels --graphstyle=automaton file.dot > file.tex \tikzstyle{automaton}=[>=stealth',initial text={},thick,every loop/.style={min distance=7mm,looseness=5}] \tikzstyle{state}=[] \tikzstyle{final}=[accepting by arrow] % % % \begin{document} \ifcorrige \title{INF105\\Contrôle de rattrapage — Corrigé\\{\normalsize Théorie des langages}} \else \title{INF105\\Contrôle de rattrapage\\{\normalsize Théorie des langages}} \fi \author{} \date{30 mars 2017} \maketitle %% {\footnotesize %% \immediate\write18{sh ./vc > vcline.tex} %% \begin{center} %% Git: \input{vcline.tex} %% \end{center} %% \immediate\write18{echo ' (stale)' >> vcline.tex} %% \par} \pretolerance=8000 \tolerance=50000 \vskip1truein\relax \noindent\textbf{Consignes.} Les exercices sont totalement indépendants. Ils pourront être traités dans un ordre quelconque, mais on demande de faire apparaître de façon très visible dans les copies où commence chaque exercice. \medbreak L'usage de tous les documents (notes de cours manuscrites ou imprimées, feuilles d'exercices, livres) est autorisé. L'usage des appareils électroniques est interdit. \medbreak Durée : 1h30 Barème \emph{indicatif} : \ifcorrige %Ce corrigé comporte 10 pages (page de garde incluse) \else %Cet énoncé comporte 4 pages (page de garde incluse) \fi \pagebreak % % % \exercice Soit $\Sigma = \{a,b\}$. (1) Représenter l'automate de Thompson $A_1$ associé à l'expression rationnelle $r$ suivante : $a{*}(ba{*}){*}$ (pour éviter toute erreur de lecture, on rappelle que dans l'écriture des expressions rationnelles, l'étoile de Kleene $*$ a une priorité plus grande que la concaténation). On demande l'automate \emph{exact} donné par la construction de Thompson pour $r$ : aucune variation ne sera autorisée, même si elle conduit à un automate équivalent. Par ailleurs, pour simplifier le travail du correcteur, on demande d'étiqueter les états de $A_1$ par les entiers naturels à partir de $0$ (soit $0,1,2,3,\ldots$) dans l'ordre correspondant à la lecture de l'expression rationnelle de la gauche vers la droite. (2) Éliminer les transitions spontanées de l'automate $A_1$ obtenu en (1), si nécessaire. (On supprimera les états devenus inutiles.) On appellera $A_2$ l'automate obtenu. (3) Déterminiser l'automate $A_2$ obtenu en (2), si nécessaire. (On demande un automate déterministe complet.) On appellera $A_3$ l'automate déterminisé. (4) Minimiser l'automate $A_3$ obtenu en (3), si nécessaire (justifier). (5) Donner une autre expression rationnelle équivalente à $r$. \begin{corrige} (1) L'automate de Thompson de $r := a{*}(ba{*}){*}$ doit comporter $12$ états (numérotés de $0$ à $11$ selon la consigne) puisque cette expression rationnelle contient $6$ symboles parenthèses non comptées. Il est l'automate $A_1$ suivant (où on a omis les $\varepsilon$ sur les transitions spontanées) : \begin{center} \scalebox{0.4}{% %%% begin cn2p1 %%% \begin{tikzpicture}[>=latex,line join=bevel,automaton] %% \node (q1) at (98bp,45bp) [draw,circle,state] {$1$}; \node (q0) at (18bp,18bp) [draw,circle,state,initial] {$0$}; \node (q3) at (258bp,18bp) [draw,circle,state] {$3$}; \node (q2) at (178bp,45bp) [draw,circle,state] {$2$}; \node (q5) at (418bp,48bp) [draw,circle,state] {$5$}; \node (q4) at (338bp,18bp) [draw,circle,state] {$4$}; \node (q7) at (578bp,86bp) [draw,circle,state] {$7$}; \node (q6) at (498bp,86bp) [draw,circle,state] {$6$}; \node (q9) at (738bp,124bp) [draw,circle,state] {$9$}; \node (q8) at (658bp,124bp) [draw,circle,state] {$8$}; \node (q11) at (904bp,25bp) [draw,circle,state,final] {$11$}; \node (q10) at (820bp,63bp) [draw,circle,state] {$10$}; \draw [->] (q0) ..controls (76.842bp,18bp) and (179.8bp,18bp) .. node[auto] {{}} (q3); \draw [->] (q2) ..controls (205.62bp,35.785bp) and (219.46bp,30.994bp) .. node[auto] {{}} (q3); \draw [->] (q10) ..controls (849.21bp,49.929bp) and (864.12bp,43.018bp) .. node[auto] {{}} (q11); \draw [->] (q7) ..controls (605.31bp,98.816bp) and (620.14bp,106.04bp) .. node[auto] {{}} (q8); \draw [->] (q8) ..controls (686.11bp,124bp) and (698.58bp,124bp) .. node[auto] {$a$} (q9); \draw [->] (q2) ..controls (154.59bp,39.764bp) and (148.04bp,38.598bp) .. (142bp,38bp) .. controls (136.68bp,37.473bp) and (131.02bp,37.771bp) .. node[auto] {{}} (q1); \draw [->] (q6) ..controls (526.11bp,86bp) and (538.58bp,86bp) .. node[auto] {{}} (q7); \draw [->] (q9) ..controls (761.45bp,107.48bp) and (772.39bp,99.343bp) .. (782bp,92bp) .. controls (786.62bp,88.47bp) and (791.54bp,84.659bp) .. node[auto] {{}} (q10); \draw [->] (q3) ..controls (286.11bp,18bp) and (298.58bp,18bp) .. node[auto] {{}} (q4); \draw [->] (q7) ..controls (637.01bp,80.44bp) and (739.57bp,70.612bp) .. node[auto] {{}} (q10); \draw [->] (q4) ..controls (370.88bp,8.0178bp) and (395.3bp,2bp) .. (417bp,2bp) .. controls (417bp,2bp) and (417bp,2bp) .. (821bp,2bp) .. controls (840.04bp,2bp) and (860.68bp,7.8211bp) .. node[auto] {{}} (q11); \draw [->] (q5) ..controls (445.31bp,60.816bp) and (460.14bp,68.042bp) .. node[auto] {$b$} (q6); \draw [->] (q10) ..controls (786bp,48.432bp) and (761.4bp,40bp) .. (739bp,40bp) .. controls (497bp,40bp) and (497bp,40bp) .. (497bp,40bp) .. controls (480.02bp,40bp) and (461.07bp,41.899bp) .. node[auto] {{}} (q5); \draw [->] (q0) ..controls (45.62bp,27.215bp) and (59.462bp,32.006bp) .. node[auto] {{}} (q1); \draw [->] (q1) ..controls (122.47bp,55.902bp) and (132.67bp,58.554bp) .. (142bp,57bp) .. controls (145.13bp,56.478bp) and (148.36bp,55.711bp) .. node[auto] {$a$} (q2); \draw [->] (q4) ..controls (365.62bp,28.238bp) and (379.46bp,33.562bp) .. node[auto] {{}} (q5); % \end{tikzpicture} %%% end cn2p1 %%% } \end{center} \smallbreak (2) Tous les états autres que $0$ (car il est initial) et $2,6,9$ (car des transitions non spontanées y aboutissent) vont disparaître ; les ε-fermetures (arrière) $C(q)$ de ces états sont les suivantes : \begin{center} \begin{tabular}{r|l} $q$&ε-fermeture $C(q)$\\ \hline $0$&$\{0,1,3,4,5,11\}$\\ $2$&$\{1,2,3,4,5,11\}$\\ $6$&$\{5,6,7,8,10,11\}$\\ $9$&$\{5,8,9,10,11\}$\\ \end{tabular} \end{center} En remplaçant chaque transition $q^\sharp \to q'$ étiquetée d'un $x\in\Sigma$ dans l'automate par une transition $q\to q'$ pour chaque état $q$ tel que $q^\sharp \in C(q)$, on obtient l'automate $A_2$ suivant : \begin{center} %%% begin cn2p1b %%% \begin{tikzpicture}[>=latex,line join=bevel,automaton] %% \node (q9) at (258bp,20.306bp) [draw,circle,state,final] {$9$}; \node (q0) at (18bp,20.306bp) [draw,circle,state,initial,final,accepting below] {$0$}; \node (q2) at (98bp,50.306bp) [draw,circle,state,final,accepting below] {$2$}; \node (q6) at (178bp,20.306bp) [draw,circle,state,final,accepting below] {$6$}; \draw [->] (q0) ..controls (45.62bp,30.544bp) and (59.462bp,35.868bp) .. node[auto] {$a$} (q2); \draw [->] (q2) to[loop above] node[auto] {$a$} (q2); \draw [->] (q6) to[loop above] node[auto] {$b$} (q6); \draw [->] (q9) to[loop above] node[auto] {$a$} (q9); \draw [->] (q9) ..controls (235.21bp,3.6347bp) and (224.28bp,-1.3057bp) .. (214bp,1.3057bp) .. controls (210.04bp,2.3107bp) and (206.05bp,3.8633bp) .. node[auto] {$b$} (q6); \draw [->] (q0) ..controls (47.887bp,13.272bp) and (64.853bp,9.7814bp) .. (80bp,8.3057bp) .. controls (95.925bp,6.7542bp) and (100.08bp,6.7542bp) .. (116bp,8.3057bp) .. controls (127.36bp,9.4124bp) and (139.74bp,11.652bp) .. node[auto] {$b$} (q6); \draw [->] (q2) ..controls (125.62bp,40.067bp) and (139.46bp,34.744bp) .. node[auto] {$b$} (q6); \draw [->] (q6) ..controls (206.11bp,20.306bp) and (218.58bp,20.306bp) .. node[auto] {$a$} (q9); % \end{tikzpicture} %%% end cn2p1b %%% \end{center} \smallbreak (3) L'automate $A_2$ est déjà déterministe (il ne comporte plus de transitions spontanées par construction, et il s'avère que chaque état a exactement une transition sortante pour chacun des symboles $a$ et $b$). On a donc $A_3 = A_2$. \smallbreak (4) Tous les états de $A_3$ sont finaux : l'algorithme de minimisation termine donc immédiatement en produisant un automate $A_4$ à un seul état ($0\equiv 2 \equiv 6 \equiv 9$), à la fois initial et final, avec des transitions étiquetées $a$ et $b$ conduisant de cet état à lui-même : \begin{center} %%% begin cn2p1c %%% \begin{tikzpicture}[>=latex,line join=bevel,automaton] %% \node (q0) at (22bp,22bp) [draw,circle,state,initial,final] {$\top$}; \draw [->] (q0) to[loop above] node[auto] {$a,b$} (q0); % \end{tikzpicture} %%% end cn2p1c %%% \end{center} \smallbreak (5) L'automate $A_4$ reconnaît manifestement le langage $\Sigma^*$ de tous les mots sur $\Sigma$. On peut donc proposer l'expression rationnelle $(a|b){*}$ (nous notons ici $|$ pour la disjonction, qu'on peut aussi noter $+$). \end{corrige} % % % \exercice À toutes fins utiles, on rappelle qu'un langage « algébrique » est un langage engendré par une grammaire hors contexte, et que l'intersection d'un langage algébrique et d'un langage rationnel est un langage algébrique. Sur l'alphabet $\Sigma = \{a,b\}$, on considère le langage $L := \{w a^n w^{\textsf{R}} : w\in\Sigma^*, n\in\mathbb{N}\}$, où $w^{\textsf{R}}$ désigne le miroir (=transposé) d'un mot $w$. Autrement dit, $L$ est le langage formé des mots qui peuvent s'écrire comme concaténation d'un mot $w$, d'un nombre quelconque (éventuellement nul) de $a$, puis du miroir du même mot $w$. On considère aussi le langage $L' := \{w a^n w : w\in\Sigma^*, n\in\mathbb{N}\}$ (sans miroir sur le troisième facteur), formé des mots qui peuvent s'écrire comme concaténation d'un mot $w$, d'un nombre quelconque (éventuellement nul) de $a$, puis du même mot $w$. (1) Donner un exemple de mot appartenant à $L$ mais pas à $L'$, et un exemple de mot appartenant à $L'$ mais pas à $L$. (2) Proposer une grammaire hors contexte qui engendre $L$ (on pourra se contenter d'une justification très succincte du fait qu'elle engendre bien $L$). En particulier, on retiendra que $L$ est algébrique (c'est tout ce qui sera nécessaire pour traiter les questions suivantes). (3) On \emph{admet}\footnote{Cela pourrait être démontré au moyen du lemme de pompage pour les langages algébriques, mais ce n'est pas demandé.} que le langage $M' := \{b^p a b^q a b^p a b^q : p,q>0\}$ n'est pas algébrique. (Autrement dit, $M'$ est l'ensemble des mots de la forme $b^p a b^q a b^p a b^q$ où $p$ et $q$ sont deux entiers naturels non nuls.) En \emph{déduire} que le langage $L'$ n'est pas algébrique. Justifier soigneusement. Pour cette question et les suivantes, on pourra introduire le langage auxiliaire $N$ dénoté par l'expression rationnelle $b^{+} a b^{+} a b^{+} a b^{+}$ où $b^{+}$ est une abréviation pour $bb{*}$ (dénotant au moins une répétition de $b$). (4a) Montrer que le langage $M := \{b^p a b^q a b^q a b^p : p,q>0\}$ (noter la différence dans l'ordre des exposants par rapport à $M'$) n'est pas rationnel.\quad (4b) En \emph{déduire} que le langage $L$ n'est pas rationnel. (5) Montrer que le langage $M$ est algébrique, sans en donner une grammaire. (6) Le langage $L'$ est-il décidable ? Est-il semi-décidable ? (7) Faire un tableau indiquant, pour chacun des quatre langages $L,L',M,M'$ considérés dans cet exercice, et pour chacune des quatre propriétés « rationnel », « algébrique », « décidable », « semi-décidable », si le langage en question a la propriété en question. \begin{corrige} (1) Le mot $babbabbab$ appartient à $L$ (prendre $w=babb$ et $n=1$) mais pas à $L'$ ; le mot $babbababb$ appartient à $L'$ (idem) mais pas à $L$. \smallbreak (2) La grammaire \[ \begin{aligned} S &\rightarrow aSa \;|\; bSb \;|\; A\\ A &\rightarrow \varepsilon \;|\; aA\\ \end{aligned} \] engendre le langage $L$ : en effet, les règles $S\rightarrow aSa$ et $S\rightarrow bSb$ permettent de placer des $a$ et $b$ symétriquement autour de $S$, c'est-à-dire de produire les $wSw^{\mathsf{R}}$ et donc $wAw^{\mathsf{R}}$, tandis que les règles $A\rightarrow\varepsilon$ et $A\rightarrow aA$ reviennent à $A\rightarrow a{*}$ et permettent de transformer $A$ en un nombre quelconque de $a$. \smallbreak (3) Le langage $M'$ est l'intersection du langage $L'$ avec le langage rationnel $N$ dénoté par l'expression rationnelle $b^{+} a b^{+} a b^{+} a b^{+}$. En effet, d'une part on a $M' \subseteq L' \cap N$, puisqu'un mot $b^p a b^q a b^p a b^q \in M'$ est évidemment dans $N$ et par ailleurs peut s'écrire $w a w$ où $w := b^p a b^q$. Mais réciproquement, on a $L'\cap N \subseteq M'$ : en effet, si pour certains $w \in \Sigma^*$ et $n \in \mathbb{N}$ le mot $w a^n w$ est dans $N$, on a forcément $n\leq 1$ car il n'y a jamais plus qu'un $a$ consécutif dans un mot de $N$, de là on en déduit que le nombre $|w|_a$ de $a$ dans $w$ vaut forcément exactement $1$ et que $n=1$ (seule possibilité pour avoir trois $a$ dans le mot au total), et finalement $w = b^p a b^q$ où $p,q>0$, et du coup $w a^n w = b^p a b^q a b^p a b^q$, qui est bien dans $M'$ comme annoncé. Sachant que $M' = L'\cap N$, puisque $N$ est rationnel par définition, et puisque $M'$ n'est pas algébrique comme il a été admis, le langage $L'$ n'est pas algébrique (l'intersection d'un langage algébrique et d'un langage rationnel étant algébrique, ainsi qu'il a été rappelé). \smallbreak (4a) Supposons par l'absurde que $M$ soit rationnel. D'après le lemme de pompage, il existe un certain $k$ tel que tout mot $x$ de $M$ de longueur $\geq k$ se factorise sous la forme $x = uvw$ avec (i) $|v|\geq 1$, (ii) $|uv|\leq k$ et (iii) $uv^iw \in M$ pour tout $i\geq 0$. Considérons le mot $x := b^k a b a b a b^k$, qui appartient à $M$ : il est censé exister une factorisation $x = uvw$ comme on vient de le dire. Mais d'après (ii), on voit que $u,v$ ne peuvent comporter que la lettre $b$ : disons $u = b^r$ et $v = b^s$, et donc $w = b^{k-r-s} a b a b a b^k$ ; la propriété (i) assure $s>0$, et on a $uv^iw = b^r b^{si} b^{k-r-s} a b a b a b^k = b^{k+s(i-1)} a b a b a b^k$, censé appartenir à $M$ pour tout $i$ d'après (iii). Or dès que $i\neq 1$, ceci clairement une contradiction. Le langage $M$ n'est donc pas rationnel. (4b) De même qu'en (3), le langage $M$ est l'intersection du langage $L$ avec le langage rationnel $N$ (dénoté par l'expression rationnelle $b^{+} a b^{+} a b^{+} a b^{+}$) : soit $M = L\cap N$. Mais puisque $N$ est rationnel par définition, et puisque $M$ n'est pas rationnel comme il a été prouvé en (4a), le langage $L$ n'est pas rationnel (l'intersection de deux langages rationnels étant rationnelle). \smallbreak (5) On a vu en (4b) que $M = L\cap N$. Comme $L$ est algébrique d'après (2), et que $N$ est rationnel, il en résulte que $M$ est algébrique (l'intersection d'un langage algébrique et d'un langage rationnel étant algébrique, ainsi qu'il a été rappelé). \smallbreak (6) On va expliquer comment écrire un algorithme qui décide si un mot $x$ de $\Sigma^*$ appartient à $L'$ : autrement dit, il s'agit de tester si $x$ peut s'écrire sous la forme $w a^n w$ pour un certain $w \in \Sigma^*$ et $n\in\mathbb{N}$. Manifestement, si c'est le cas, la longueur $|w|$ de $w$ est majorée par $\frac{1}{2}|x|$ et qu'on a $n = |x| - 2|w|$, donc on peut procéder ainsi : pour chaque $k$ entier allant de $0$ à $\frac{1}{2}|x|$, et en appelant $n := |x|-2k$, tester si le préfixe de longueur $k$ de $x$ et son suffixe de longueur $k$ sont égaux et si les $n$ lettres entre les positions $k$ incluse (en compsant à partir de $0$) et $k+n$ exclue sont toutes des $a$ : si oui, retourner vrai, et si la boucle se finit sans que la condition soit vérifiée, retourner faux. (De façon plus expéditive : comme la longueur de $w$ et la valeur de $n$ sont bornées, il n'y a qu'un nombre fini de possibilités à tester qui pourraient faire que $x = w a^n w$, donc quitte à tester tous les $w$ de longueur $\leq\frac{1}{2}|x|$ et tous les $n$ possibles jusqu'à $|x|$, on peut tester si on a $x = w a^n w$.) Comme $L'$ est décidable, en particulier, il est semi-décidable. \smallbreak (7) En se rappelant qu'un langage rationnel est algébrique, qu'un algébrique est décidable, et qu'un décidable est semi-décidable, et en ajoutant par ailleurs la colonne $N$ (qui n'était pas demandée), on a le tableau suivant : \begin{center} \begin{tabular}{r|ccccc} &$L$&$L'$&$M$&$M'$&$N$\\\hline rationnel ?&NON&NON&NON&NON&oui\\ algébrique ?&oui&NON&oui&NON&oui\\ décidable ?&oui&oui&oui&oui&oui\\ semi-décidable ?&oui&oui&oui&oui&oui\\ \end{tabular} \end{center} \vskip-\baselineskip\vskip-1ex\strut \end{corrige} % % % \end{document}