%% This is a LaTeX document. Hey, Emacs, -*- latex -*- , get it? \documentclass[12pt,a4paper]{article} \usepackage[francais]{babel} \usepackage[utf8]{inputenc} \usepackage[T1]{fontenc} %\usepackage{ucs} \usepackage{times} % A tribute to the worthy AMS: \usepackage{amsmath} \usepackage{amsfonts} \usepackage{amssymb} \usepackage{amsthm} % \usepackage{mathrsfs} \usepackage{wasysym} \usepackage{url} % \usepackage{graphics} \usepackage[usenames,dvipsnames]{xcolor} \usepackage{tikz} \usetikzlibrary{arrows,automata,positioning} \usepackage{hyperref} % \theoremstyle{definition} \newtheorem{comcnt}{Tout} \newcommand\thingy{% \refstepcounter{comcnt}\smallbreak\noindent\textbf{\thecomcnt.} } \newcommand\exercice{% \refstepcounter{comcnt}\bigbreak\noindent\textbf{Exercice~\thecomcnt.}} \renewcommand{\qedsymbol}{\smiley} % \DeclareUnicodeCharacter{00A0}{~} \DeclareUnicodeCharacter{03B5}{$\varepsilon$} % \DeclareMathSymbol{\tiret}{\mathord}{operators}{"7C} \DeclareMathSymbol{\traitdunion}{\mathord}{operators}{"2D} \newcommand{\liff}{\mathrel{\Longleftrightarrow}\relax} % % \DeclareFontFamily{U}{manual}{} \DeclareFontShape{U}{manual}{m}{n}{ <-> manfnt }{} \newcommand{\manfntsymbol}[1]{% {\fontencoding{U}\fontfamily{manual}\selectfont\symbol{#1}}} \newcommand{\dbend}{\manfntsymbol{127}}% Z-shaped \newcommand{\danger}{\noindent\hangindent\parindent\hangafter=-2% \hbox to0pt{\hskip-\hangindent\dbend\hfill}} % \newcommand{\spaceout}{\hskip1emplus2emminus.5em} \newif\ifcorrige \corrigetrue \newenvironment{corrige}% {\ifcorrige\relax\else\setbox0=\vbox\bgroup\fi% \smallbreak\noindent{\underbar{\textit{Corrigé.}}\quad}} {{\hbox{}\nobreak\hfill\checkmark}% \ifcorrige\relax\else\egroup\fi\par} \newenvironment{commentaire}% {\ifcorrige\relax\else\setbox0=\vbox\bgroup\fi% \smallbreak\noindent{\underbar{\textit{Commentaires.}}\quad}} {{\hbox{}\nobreak\hfill\maltese}% \ifcorrige\relax\else\egroup\fi\par} % % % NOTE: compile dot files with % dot2tex --figonly -f tikz --tikzedgelabels --graphstyle=automaton file.dot > file.tex \tikzstyle{automaton}=[>=stealth',initial text={},thick,every loop/.style={min distance=7mm,looseness=5}] \tikzstyle{state}=[] \tikzstyle{final}=[accepting by arrow] % % % \begin{document} \ifcorrige \title{INF105\\Contrôle de rattrapage — Corrigé\\{\normalsize Théorie des langages}} \else \title{INF105\\Contrôle de rattrapage\\{\normalsize Théorie des langages}} \fi \author{} \date{30 mars 2017} \maketitle %% {\footnotesize %% \immediate\write18{sh ./vc > vcline.tex} %% \begin{center} %% Git: \input{vcline.tex} %% \end{center} %% \immediate\write18{echo ' (stale)' >> vcline.tex} %% \par} \pretolerance=8000 \tolerance=50000 \vskip1truein\relax \noindent\textbf{Consignes.} Les exercices sont totalement indépendants. Ils pourront être traités dans un ordre quelconque, mais on demande de faire apparaître de façon très visible dans les copies où commence chaque exercice. \medbreak L'usage de tous les documents (notes de cours manuscrites ou imprimées, feuilles d'exercices, livres) est autorisé. L'usage des appareils électroniques est interdit. \medbreak Durée : 1h30 Barème \emph{indicatif} : $8$ points pour chacun des deux premiers exercices, $4$ pour l'exercice 3. \ifcorrige %Ce corrigé comporte 7 pages (page de garde incluse) \else Cet énoncé comporte 3 pages (page de garde incluse) \fi \pagebreak % % % \exercice Soit $\Sigma = \{a,b\}$. (1) Représenter l'automate de Thompson $A_1$ associé à l'expression rationnelle $r$ suivante : $a^{*}(ba^{*})^{*}$ (pour éviter toute erreur de lecture, on rappelle que dans l'écriture des expressions rationnelles, l'étoile de Kleene $*$ a une priorité plus grande que la concaténation). On demande l'automate \emph{exact} donné par la construction de Thompson pour $r$ : aucune variation ne sera autorisée, même si elle conduit à un automate équivalent. Pour simplifier le travail du correcteur, on numérotera $0$ l'état initial. (2) Éliminer les transitions spontanées de l'automate $A_1$ obtenu en (1), si nécessaire. (On supprimera les états devenus inutiles.) On appellera $A_2$ l'automate obtenu. (3) Déterminiser l'automate $A_2$ obtenu en (2), si nécessaire. (On demande un automate déterministe complet.) On appellera $A_3$ l'automate déterminisé. (4) Minimiser l'automate $A_3$ obtenu en (3), si nécessaire (justifier). (5) Donner une autre expression rationnelle équivalente à $r$. (On pourra utiliser le résultat de la question (4).) \begin{corrige} (1) L'automate de Thompson de $r := a^{*}(ba^{*})^{*}$ doit comporter $12$ états (numérotés de $0$ à $11$ selon la consigne) puisque cette expression rationnelle contient $6$ symboles parenthèses non comptées. Il est l'automate $A_1$ suivant (où on a omis les $\varepsilon$ sur les transitions spontanées) : \begin{center} \scalebox{0.4}{% %%% begin cn2p1 %%% \begin{tikzpicture}[>=latex,line join=bevel,automaton] %% \node (q1) at (97bp,45bp) [draw,circle,state] {$1$}; \node (q0) at (18bp,18bp) [draw,circle,state,initial] {$0$}; \node (q3) at (255bp,18bp) [draw,circle,state] {$3$}; \node (q2) at (176bp,45bp) [draw,circle,state] {$2$}; \node (q5) at (413bp,48bp) [draw,circle,state] {$5$}; \node (q4) at (334bp,18bp) [draw,circle,state] {$4$}; \node (q7) at (571bp,86bp) [draw,circle,state] {$7$}; \node (q6) at (492bp,86bp) [draw,circle,state] {$6$}; \node (q9) at (729bp,124bp) [draw,circle,state] {$9$}; \node (q8) at (650bp,124bp) [draw,circle,state] {$8$}; \node (q11) at (891.49bp,25bp) [draw,circle,state,final] {$11$}; \node (q10) at (809.5bp,63bp) [draw,circle,state] {$10$}; \draw [->] (q0) ..controls (59.7bp,17.371bp) and (103.03bp,16.838bp) .. (140bp,17bp) .. controls (169.56bp,17.13bp) and (203.43bp,17.448bp) .. node[auto] {{}} (q3); \draw [->] (q2) ..controls (203.44bp,35.73bp) and (216.64bp,31.102bp) .. node[auto] {{}} (q3); \draw [->] (q10) ..controls (838.18bp,49.853bp) and (852.23bp,43.176bp) .. node[auto] {{}} (q11); \draw [->] (q7) ..controls (598.12bp,98.892bp) and (612.27bp,105.87bp) .. node[auto] {{}} (q8); \draw [->] (q8) ..controls (672.67bp,132.8bp) and (679.54bp,134.92bp) .. (686bp,136bp) .. controls (691.61bp,136.94bp) and (697.54bp,136.29bp) .. node[auto] {$a$} (q9); \draw [->] (q2) ..controls (152.62bp,39.018bp) and (146.07bp,37.685bp) .. (140bp,37bp) .. controls (134.92bp,36.427bp) and (129.53bp,36.741bp) .. node[auto] {{}} (q1); \draw [->] (q6) ..controls (519.66bp,86bp) and (531.82bp,86bp) .. node[auto] {{}} (q7); \draw [->] (q9) ..controls (752.24bp,107.21bp) and (762.74bp,99.206bp) .. (772bp,92bp) .. controls (776.47bp,88.521bp) and (781.23bp,84.776bp) .. node[auto] {{}} (q10); \draw [->] (q3) ..controls (282.66bp,18bp) and (294.82bp,18bp) .. node[auto] {{}} (q4); \draw [->] (q7) ..controls (629.17bp,80.44bp) and (730.23bp,70.612bp) .. node[auto] {{}} (q10); \draw [->] (q9) ..controls (703.63bp,117.47bp) and (694.39bp,116.17bp) .. (686bp,117bp) .. controls (683.26bp,117.27bp) and (680.42bp,117.66bp) .. node[auto] {{}} (q8); \draw [->] (q4) ..controls (366.77bp,7.9414bp) and (390.7bp,2bp) .. (412bp,2bp) .. controls (412bp,2bp) and (412bp,2bp) .. (810.5bp,2bp) .. controls (828.87bp,2bp) and (848.73bp,7.6737bp) .. node[auto] {{}} (q11); \draw [->] (q5) ..controls (440.12bp,60.892bp) and (454.27bp,67.873bp) .. node[auto] {$b$} (q6); \draw [->] (q10) ..controls (775.83bp,48.323bp) and (751.87bp,40bp) .. (730bp,40bp) .. controls (491bp,40bp) and (491bp,40bp) .. (491bp,40bp) .. controls (474.34bp,40bp) and (455.77bp,41.875bp) .. node[auto] {{}} (q5); \draw [->] (q0) ..controls (45.436bp,27.27bp) and (58.635bp,31.898bp) .. node[auto] {{}} (q1); \draw [->] (q1) ..controls (121.23bp,55.953bp) and (131.02bp,58.496bp) .. (140bp,57bp) .. controls (143.13bp,56.478bp) and (146.36bp,55.711bp) .. node[auto] {$a$} (q2); \draw [->] (q4) ..controls (361.28bp,28.238bp) and (374.94bp,33.562bp) .. node[auto] {{}} (q5); % \end{tikzpicture} %%% end cn2p1 %%% } \end{center} \smallbreak (2) Tous les états autres que $0$ (car il est initial) et $2,6,9$ (car des transitions non spontanées y aboutissent) vont disparaître ; les ε-fermetures (arrière) $C(q)$ de ces états sont les suivantes : \begin{center} \begin{tabular}{r|l} $q$&ε-fermeture $C(q)$\\ \hline $0$&$\{0,1,3,4,5,11\}$\\ $2$&$\{1,2,3,4,5,11\}$\\ $6$&$\{5,6,7,8,10,11\}$\\ $9$&$\{5,8,9,10,11\}$\\ \end{tabular} \end{center} En remplaçant chaque transition $q^\sharp \to q'$ étiquetée d'un $x\in\Sigma$ dans l'automate par une transition $q\to q'$ pour chaque état $q$ tel que $q^\sharp \in C(q)$, on obtient l'automate $A_2$ suivant : \begin{center} %%% begin cn2p1b %%% \begin{tikzpicture}[>=latex,line join=bevel,automaton] %% \node (q9) at (258bp,20.306bp) [draw,circle,state,final] {$9$}; \node (q0) at (18bp,20.306bp) [draw,circle,state,initial,final,accepting below] {$0$}; \node (q2) at (98bp,50.306bp) [draw,circle,state,final,accepting below] {$2$}; \node (q6) at (178bp,20.306bp) [draw,circle,state,final,accepting below] {$6$}; \draw [->] (q0) ..controls (45.62bp,30.544bp) and (59.462bp,35.868bp) .. node[auto] {$a$} (q2); \draw [->] (q2) to[loop above] node[auto] {$a$} (q2); \draw [->] (q6) to[loop above] node[auto] {$b$} (q6); \draw [->] (q9) to[loop above] node[auto] {$a$} (q9); \draw [->] (q9) ..controls (235.21bp,3.6347bp) and (224.28bp,-1.3057bp) .. (214bp,1.3057bp) .. controls (210.04bp,2.3107bp) and (206.05bp,3.8633bp) .. node[auto] {$b$} (q6); \draw [->] (q0) ..controls (47.887bp,13.272bp) and (64.853bp,9.7814bp) .. (80bp,8.3057bp) .. controls (95.925bp,6.7542bp) and (100.08bp,6.7542bp) .. (116bp,8.3057bp) .. controls (127.36bp,9.4124bp) and (139.74bp,11.652bp) .. node[auto] {$b$} (q6); \draw [->] (q2) ..controls (125.62bp,40.067bp) and (139.46bp,34.744bp) .. node[auto] {$b$} (q6); \draw [->] (q6) ..controls (206.11bp,20.306bp) and (218.58bp,20.306bp) .. node[auto] {$a$} (q9); % \end{tikzpicture} %%% end cn2p1b %%% \end{center} \smallbreak (3) L'automate $A_2$ est déjà déterministe (il ne comporte plus de transitions spontanées par construction, et il s'avère que chaque état a exactement une transition sortante pour chacun des symboles $a$ et $b$). On a donc $A_3 = A_2$. \smallbreak (4) Tous les états de $A_3$ sont finaux : l'algorithme de minimisation termine donc immédiatement en produisant un automate $A_4$ à un seul état ($0\equiv 2 \equiv 6 \equiv 9$), à la fois initial et final, avec des transitions étiquetées $a$ et $b$ conduisant de cet état à lui-même : \begin{center} %%% begin cn2p1c %%% \begin{tikzpicture}[>=latex,line join=bevel,automaton] %% \node (q0) at (22bp,22bp) [draw,circle,state,initial,final] {$\top$}; \draw [->] (q0) to[loop above] node[auto] {$a,b$} (q0); % \end{tikzpicture} %%% end cn2p1c %%% \end{center} \smallbreak (5) L'automate $A_4$ reconnaît manifestement le langage $\Sigma^*$ de tous les mots sur $\Sigma$. On peut donc proposer l'expression rationnelle $(a|b)^{*}$ (nous notons ici $|$ pour la disjonction, qu'on peut aussi noter $+$). \end{corrige} \begin{commentaire} Cet exercice a été noté sur $8$ (dans une note finale sur $21$ considérée comme sur $20$). La question (4) a fait l'objet de beaucoup d'erreurs : beaucoup de copies affirment qu'on « ne peut pas » minimiser l'automate, ou que l'algorithme de Moore « échoue » ou encore qu'il « termine immédiatement » et que l'automate est déjà minimal (ce que, de toute évidence, il n'est pas). À cause de cela, la question (5) a été rendue beaucoup plus compliquée (ce qui n'était pas dans l'intention de l'auteur du sujet). De façon plus générale, il est dommage qu'une expression aussi simple que $a^{*}(ba^{*})^{*}$ ne soit pas immédiatement déchiffrée comme dénotant le langage $\Sigma^*$ de tous les mots sur $\Sigma = \{a,b\}$, ce qui aurait permis de répondre immédiatement à la question (5), ou au moins de vérifier cette réponse. \end{commentaire} % % % \exercice Pour cet exercice, on rappelle qu'un langage \textit{algébrique} est un langage engendré par une grammaire hors contexte, et que l'intersection d'un langage algébrique et d'un langage rationnel est un langage algébrique. Sur l'alphabet $\Sigma = \{a,b\}$, on considère le langage $L := \{w a^n w^{\textsf{R}} : w\in\Sigma^*, n\in\mathbb{N}\}$, où $w^{\textsf{R}}$ désigne le miroir (=transposé) d'un mot $w$. Autrement dit, $L$ est le langage formé des mots qui peuvent s'écrire comme concaténation d'un mot $w$, d'un nombre quelconque (éventuellement nul) de $a$, puis du miroir du même mot $w$. On considère aussi le langage $L' := \{w a^n w : w\in\Sigma^*, n\in\mathbb{N}\}$ (sans miroir sur le troisième facteur), formé des mots qui peuvent s'écrire comme concaténation d'un mot $w$, d'un nombre quelconque (éventuellement nul) de $a$, puis du même mot $w$. (1) Donner un exemple de mot appartenant à $L$ mais pas à $L'$, et un exemple de mot appartenant à $L'$ mais pas à $L$. (2) Proposer une grammaire hors contexte qui engendre $L$ (on pourra se contenter d'une justification très succincte du fait qu'elle engendre bien $L$). En particulier, on retiendra que $L$ est algébrique (c'est tout ce qui sera nécessaire pour traiter les questions suivantes). Pour les questions (3) à (5), on pourra introduire le langage auxiliaire $N$ dénoté par l'expression rationnelle $b^{+} a b^{+} a b^{+} a b^{+}$ où on rappelle que $b^{+}$ est une abréviation pour $bb^{*}$ (c'est-à-dire $\geq 1$ répétitions de $b$). (3) On \emph{admet}\footnote{Cela pourrait être démontré au moyen du lemme de pompage pour les langages algébriques, mais ce n'est pas demandé.} que le langage $M' := \{b^p a b^q a b^p a b^q : p,q>0\}$ n'est pas algébrique. En \emph{déduire} que le langage $L'$ n'est pas algébrique. Justifier soigneusement. (4a) Montrer que le langage $M := \{b^p a b^q a b^q a b^p : p,q>0\}$ (noter la différence dans l'ordre des exposants par rapport à $M'$) n'est pas rationnel.\quad (4b) En \emph{déduire} que le langage $L$ n'est pas rationnel. (5) Montrer que le langage $M$ est algébrique, sans en donner une grammaire. (6) Le langage $L'$ est-il décidable ? Est-il semi-décidable ? (7) Faire un tableau indiquant, pour chacun des quatre langages $L,L',M,M'$ considérés dans cet exercice, et pour chacune des quatre propriétés « rationnel », « algébrique », « décidable », « semi-décidable », si le langage en question a la propriété en question. \begin{corrige} (1) Le mot $abba$ appartient à $L$ (prendre $w=ab$ et $n=0$) mais pas à $L'$ ; le mot $abab$ appartient à $L'$ (idem) mais pas à $L$. Autre exemple : le mot $babbabbab$ appartient à $L$ (prendre $w=babb$ et $n=1$) mais pas à $L'$ ; le mot $babbababb$ appartient à $L'$ (idem) mais pas à $L$. \smallbreak (2) La grammaire \[ \begin{aligned} S &\rightarrow aSa \;|\; bSb \;|\; A\\ A &\rightarrow \varepsilon \;|\; aA\\ \end{aligned} \] engendre le langage $L$ : en effet, les règles $S\rightarrow aSa$ et $S\rightarrow bSb$ permettent de placer des $a$ et $b$ symétriquement autour de $S$, c'est-à-dire de produire les $wSw^{\mathsf{R}}$ et donc $wAw^{\mathsf{R}}$, tandis que les règles $A\rightarrow\varepsilon$ et $A\rightarrow aA$ permettent de transformer $A$ en un nombre quelconque de $a$. \smallbreak (3) Le langage $M'$ est l'intersection du langage $L'$ avec le langage rationnel $N$ dénoté par l'expression rationnelle $b^{+} a b^{+} a b^{+} a b^{+}$. En effet, d'une part on a $M' \subseteq L' \cap N$, puisqu'un mot $b^p a b^q a b^p a b^q \in M'$ est évidemment dans $N$ et par ailleurs peut s'écrire $w a w$ où $w := b^p a b^q$. Mais réciproquement, on a $L'\cap N \subseteq M'$ : en effet, si pour certains $w \in \Sigma^*$ et $n \in \mathbb{N}$ le mot $w a^n w$ est dans $N$, on a forcément $n\leq 1$ car il n'y a jamais plus d'un $a$ consécutif dans un mot de $N$, de là on en déduit que le nombre $|w|_a$ de $a$ dans $w$ vaut forcément exactement $1$ et que $n=1$ (seule possibilité pour avoir trois $a$ dans le mot au total), et finalement $w = b^p a b^q$ où $p,q>0$, et du coup $w a^n w = b^p a b^q a b^p a b^q$, qui est bien dans $M'$ comme annoncé. Sachant que $M' = L'\cap N$, puisque $N$ est rationnel par définition, et puisque $M'$ n'est pas algébrique comme il a été admis, le langage $L'$ n'est pas algébrique (l'intersection d'un langage algébrique et d'un langage rationnel étant algébrique, ainsi qu'il a été rappelé). \smallbreak (4a) Supposons par l'absurde que $M$ soit rationnel. D'après le lemme de pompage, il existe un certain $k$ tel que tout mot $x$ de $M$ de longueur $\geq k$ se factorise sous la forme $x = uvw$ avec (i) $|v|\geq 1$, (ii) $|uv|\leq k$ et (iii) $uv^iw \in M$ pour tout $i\geq 0$. Considérons le mot $x := b^k a b a b a b^k$, qui appartient à $M$ : il est censé exister une factorisation $x = uvw$ comme on vient de le dire. Mais d'après (ii), on voit que $u,v$ ne peuvent comporter que la lettre $b$ : disons $u = b^r$ et $v = b^s$, et donc $w = b^{k-r-s} a b a b a b^k$ ; la propriété (i) assure $s>0$, et on a $uv^iw = b^r b^{si} b^{k-r-s} a b a b a b^k = b^{k+s(i-1)} a b a b a b^k$, censé appartenir à $M$ pour tout $i$ d'après (iii). Or dès que $i\neq 1$, ceci est clairement une contradiction. Le langage $M$ n'est donc pas rationnel. (4b) De même qu'en (3), le langage $M$ est l'intersection du langage $L$ avec le langage rationnel $N$ (dénoté par l'expression rationnelle $b^{+} a b^{+} a b^{+} a b^{+}$) : soit $M = L\cap N$. Mais puisque $N$ est rationnel par définition, et puisque $M$ n'est pas rationnel comme il a été prouvé en (4a), le langage $L$ n'est pas rationnel (l'intersection de deux langages rationnels étant rationnelle). \smallbreak (5) On a vu en (4b) que $M = L\cap N$. Comme $L$ est algébrique d'après (2), et que $N$ est rationnel, il en résulte que $M$ est algébrique (l'intersection d'un langage algébrique et d'un langage rationnel étant algébrique, ainsi qu'il a été rappelé). \smallbreak (6) On va expliquer comment écrire un algorithme qui décide si un mot $x$ de $\Sigma^*$ appartient à $L'$ : autrement dit, il s'agit de tester si $x$ peut s'écrire sous la forme $w a^n w$ pour un certain $w \in \Sigma^*$ et $n\in\mathbb{N}$. Manifestement, si c'est le cas, la longueur $|w|$ de $w$ est majorée par $\frac{1}{2}|x|$ et qu'on a $n = |x| - 2|w|$, donc on peut procéder ainsi : pour chaque $k$ entier allant de $0$ à $\frac{1}{2}|x|$, et en appelant $n := |x|-2k$, tester si le préfixe de longueur $k$ de $x$ et son suffixe de longueur $k$ sont égaux et si les $n$ lettres entre les positions $k$ incluse (en compsant à partir de $0$) et $k+n$ exclue sont toutes des $a$ : si oui, retourner vrai, et si la boucle se finit sans que la condition soit vérifiée, retourner faux. (De façon plus expéditive : comme la longueur de $w$ et la valeur de $n$ sont bornées, il n'y a qu'un nombre fini de possibilités à tester qui pourraient faire que $x = w a^n w$, donc quitte à tester tous les $w$ de longueur $\leq\frac{1}{2}|x|$ et tous les $n$ possibles jusqu'à $|x|$, on peut tester si on a $x = w a^n w$.) Comme $L'$ est décidable, en particulier, il est semi-décidable. \smallbreak (7) En se rappelant qu'un langage rationnel est algébrique, qu'un algébrique est décidable, et qu'un décidable est semi-décidable, et en ajoutant par ailleurs la colonne $N$ (qui n'était pas demandée), on a le tableau suivant : \begin{center} \begin{tabular}{r|ccccc} &$L$&$L'$&$M$&$M'$&$N$\\\hline rationnel ?&NON&NON&NON&NON&oui\\ algébrique ?&oui&NON&oui&NON&oui\\ décidable ?&oui&oui&oui&oui&oui\\ semi-décidable ?&oui&oui&oui&oui&oui\\ \end{tabular} \end{center} \vskip-\baselineskip\vskip-1ex\strut \end{corrige} \begin{commentaire} Cet exercice a été noté sur $9$ (dans une note finale sur $21$ considérée comme sur $20$). La question (2) révèle une grande incompréhension de ce qu'est une grammaire hors-contexte : certains proposent par exemple des règles du genre $C \rightarrow A^{\mathsf{R}}$ (on ne sait même pas ce que ça pourrait vouloir dire). Dans les questions (3) à (5) (qui étaient basées sur le fait que $M = L\cap N$ et $M' = L'\cap N$, cf. corrigé), beaucoup ont observé que $M \subseteq L$ et/ou que $M' \subseteq L'$ (ce qui est correct) et ont cru pouvoir en déduire que $L'$ n'est pas algébrique ou que $M$ l'est, ou autres conclusions du même genre. Rappelons donc clairement : \emph{un sous-langage d'un langage algébrique n'est pas nécessairement algébrique} (et de même avec « rationnel », ou avec « sur-langage ») ; d'ailleurs, étant donné que tous les langages sont des sous-langages de $\Sigma^*$, cela rendrait la théorie très peu intéressante ! Pour la question (4a), dans l'application du lemme de pompage, très peu nombreux sont ceux qui ont compris que quand on utilise ce lemme, on \emph{choisit} le mot $x$ dont on va demander une factorisation $x=uvw$ (en revanche, on ne choisit pas la factorisation !). Pour la question (7), il suffisait pour avoir les points de dresser un tableau compatible avec les implications « rationnel implique algébrique implique décidable implique semi-décidable » (donc ne pas affirmer qu'un langage serait, par exemple, algébrique mais non décidable) ainsi qu'avec les résultats explicitement affirmés dans les questions précédentes. Malgré cela, \emph{une seule copie} a correctement dressé un tel tableau ! \end{commentaire} % % % \exercice On rappelle que le \textit{problème (ou langage) de l'arrêt} $H$ est l'ensemble des couples\footnote{Pour être rigoureux, on a fixé un codage permettant de représenter les programmes $e$, les entrées $x$ à ces programmes, et les couples $(e,x)$ comme des mots sur un certain alphabet, par exemple $\Sigma = \{0,1\}$. (Il n'est pas nécessaire de faire apparaître ce codage dans la description des algorithmes proposés, qui peut rester informelle.)} $(e,x)$ formés d'un programme (=algorithme) $e$ et d'une entrée $x$, tels que l'exécution du programme $e$ sur l'entrée $x$ termine en temps fini. On rappelle que le problème de l'arrêt $H$ est semi-décidable mais non décidable : autrement dit, on ne peut pas décider à l'avance en temps fini si un programme $e$ donné va terminer sur une entrée $x$, mais on peut au moins vérifier que c'est le cas quand ça l'est. On définit ici la variante $H'$ suivante du problème de l'arrêt : $H'$ est l'ensemble des couples $(e,x)$ formés d'un programme $e$ et d'une entrée $x$, tels que l'exécution du programme $e$ sur l'entrée $x$ termine en temps fini et renvoie la réponse $42$. Ainsi, on a $H' \subseteq H$ (ce fait est destiné à éclaircir la définition de $H'$ mais n'est pas utile pour la suite). (1) Montrer que $H'$ est semi-décidable. (2) Montrer que $H'$ n'est pas décidable : pour cela, on pourra, \emph{au choix} : \begin{itemize} \item montrer directement que $H'$ n'est pas décidable, en imitant la démonstration du cours que $H$ n'est pas décidable (on pourra essayer de construire un programme qui contredit la prédiction faite par $H'$ sur son comportement), \emph{ou bien} \item montrer que si $H'$ était décidable, $H$ le serait aussi, ce qui constitue une contradiction (donné un programme $e$, on pourra modifier celui-ci en un programme $e'$ de manière à rendre utile la prédiction faite par $H'$ sur son comportement). \end{itemize} \begin{corrige} (1) Le fait que $H'$ soit semi-décidable se montre de la même manière que le fait que $H$ l'est : donnés un programme $e$ et une entrée $x$, on lance l'exécution de $e$ sur l'entrée $x$ (au moyen, si on veut être précis, d'une « machine universelle »), et si cette exécution termine et renvoie la valeur $42$, on renvoie « vrai », sinon on rentre dans une boucle infinie (ou on renvoie « faux », peu importe) ; bien sûr, si l'exécution de $e$ sur $x$ ne termine pas, l'algorithme qu'on vient de décrire ne terminera pas non plus. Au final, on a bien décrit un algorithme qui semi-décide $H'$. \smallbreak (2) Donnons deux solutions, correspondant aux deux approches suggérées par l'énoncé. \emph{Première approche} (montrer directement que $H'$ n'est pas décidable) : Si $H'$ était décidable, on pourrait définir un algorithme qui, donné un programme $e$, effectue les calculs suivants : (1º) utiliser un algorithme décidant $H'$ (on a supposé qu'il en existe un) pour savoir, algorithmiquement en temps fini, si le programme $e$ termine et renvoie $42$ quand on lui passe son propre numéro $e$ en entrée, et (2º) si oui, terminer en renvoyant la valeur $43$ (disons), et si non, terminer en renvoyant $42$. L'algorithme qui vient d'être décrit correspond à un certain programme, disons, $p$, et la description de l'algorithme fait que, quelque soit $e$, la valeur renvoyée par $p$ sur $e$ vaut $43$ si celle renvoyée par $e$ sur $e$ vaut $42$, et vaut $42$ sinon (y compris si $e$ ne termine pas sur l'entrée $e$). En particulier, en prenant $e=p$, on voit que la valeur renvoyée par $p$ sur $p$ vaut $42$ si et seulement si elle ne vaut pas $42$, ce qui est une contradiction. C'est donc que $H'$ n'était, en fait, pas décidable. \emph{Seconde approche} (ramener l'indécidabilité de $H'$ à celle de $H$) : Supposons par l'absurde que $H'$ soit décidable (c'est-à-dire, concrètement, qu'on dispose d'un moyen de savoir si un programme $e$, quand on lui fournit une entrée $x$, termine en renvoyant la valeur $42$) et montrons, pour arriver à une contradiction, que $H$ l'est aussi. Donnés un programme $e$ et une entrée $x$, on peut construire \emph{algorithmiquement} le programme $e'$ suivant : il effectue les mêmes opérations que $e$, mais, à la fin, ignore le résultat calculé, et renvoie toujours $42$. Ainsi, l'exécution de $e'$ sur l'entrée $x$ termine et renvoie $42$ si et seulement si celle de $e$ sur cette même entrée termine (et renvoie n'importe quoi). Comme on a supposé que $H'$ était décidable, on peut alors utiliser un algorithme qui le décide pour savoir si $e'$ termine (sur l'entrée $x$) en renvoyant $42$ : comme ceci revient au même que de savoir si $e$ termine (sur l'entrée $x$), ceci fournit un moyen pour savoir si $e$ termine (sur l'entrée $x$). Autrement dit, on a résolu algorithmiquement le problème de l'arrêt, ce qui est une contradiction. C'est donc que $H'$ n'était, en fait, pas décidable. \end{corrige} \begin{commentaire} Cet exercice a été noté sur $4$ (dans une note finale sur $21$ considérée comme sur $20$). Quelques réponses correctes (ou largement correctes) ont été trouvées. La principale erreur commise par ceux qui ont abordé l'exercice sans le traiter correctement était de penser que $H' \subseteq H$ avec $H$ semi-décidable implique $H'$ semi-décidable (l'énoncé signalait pourtant explicitement que cette inclusion n'était pas utile !) ; cf. les commentaires sur les questions (3) à (5) de l'exercice précédent. \end{commentaire} % % % \end{document}