%% This is a LaTeX document. Hey, Emacs, -*- latex -*- , get it? \documentclass[12pt,a4paper]{article} \usepackage[francais]{babel} \usepackage[utf8]{inputenc} \usepackage[T1]{fontenc} %\usepackage{ucs} \usepackage{times} % A tribute to the worthy AMS: \usepackage{amsmath} \usepackage{amsfonts} \usepackage{amssymb} \usepackage{amsthm} % \usepackage{mathrsfs} \usepackage{wasysym} \usepackage{url} % \usepackage{graphics} \usepackage[usenames,dvipsnames]{xcolor} \usepackage{tikz} \usetikzlibrary{arrows,automata,positioning} \usepackage{hyperref} % \theoremstyle{definition} \newtheorem{comcnt}{Tout} \newcommand\thingy{% \refstepcounter{comcnt}\smallbreak\noindent\textbf{\thecomcnt.} } \newcommand\exercice{% \refstepcounter{comcnt}\bigbreak\noindent\textbf{Exercice~\thecomcnt.}} \renewcommand{\qedsymbol}{\smiley} % \DeclareUnicodeCharacter{00A0}{~} \DeclareUnicodeCharacter{03B5}{$\varepsilon$} % \DeclareMathSymbol{\tiret}{\mathord}{operators}{"7C} \DeclareMathSymbol{\traitdunion}{\mathord}{operators}{"2D} % % \DeclareFontFamily{U}{manual}{} \DeclareFontShape{U}{manual}{m}{n}{ <-> manfnt }{} \newcommand{\manfntsymbol}[1]{% {\fontencoding{U}\fontfamily{manual}\selectfont\symbol{#1}}} \newcommand{\dbend}{\manfntsymbol{127}}% Z-shaped \newcommand{\danger}{\noindent\hangindent\parindent\hangafter=-2% \hbox to0pt{\hskip-\hangindent\dbend\hfill}} % \newcommand{\spaceout}{\hskip1emplus2emminus.5em} \newif\ifcorrige \corrigetrue \newenvironment{corrige}% {\ifcorrige\relax\else\setbox0=\vbox\bgroup\fi% \smallbreak\noindent{\underbar{\textit{Corrigé.}}\quad}} {{\hbox{}\nobreak\hfill\checkmark}% \ifcorrige\relax\else\egroup\fi\par} \newenvironment{commentaire}% {\ifcorrige\relax\else\setbox0=\vbox\bgroup\fi% \smallbreak\noindent{\underbar{\textit{Commentaires.}}\quad}} {{\hbox{}\nobreak\hfill\maltese}% \ifcorrige\relax\else\egroup\fi\par} % % % NOTE: compile dot files with % dot2tex --figonly -f tikz --tikzedgelabels --graphstyle=automaton file.dot > file.tex \tikzstyle{automaton}=[>=stealth',initial text={},thick,every loop/.style={min distance=7mm,looseness=5}] \tikzstyle{state}=[] \tikzstyle{final}=[accepting by arrow] % % % \begin{document} \ifcorrige \title{INF105\\Contrôle de connaissances — Corrigé\\{\normalsize Théorie des langages}} \else \title{INF105\\Contrôle de connaissances\\{\normalsize Théorie des langages}} \fi \author{} \date{6 février 2018} \maketitle %% {\footnotesize %% \immediate\write18{sh ./vc > vcline.tex} %% \begin{center} %% Git: \input{vcline.tex} %% \end{center} %% \immediate\write18{echo ' (stale)' >> vcline.tex} %% \par} \pretolerance=8000 \tolerance=50000 \vskip1truein\relax \noindent\textbf{Consignes.} Les exercices sont totalement indépendants. Ils pourront être traités dans un ordre quelconque, mais on demande de faire apparaître de façon très visible dans les copies où commence chaque exercice. \medbreak Le sujet étant long pour le temps imparti, il ne sera pas nécessaire de traiter toutes les questions pour obtenir la totalité des points. \medbreak L'usage de tous les documents (notes de cours manuscrites ou imprimées, feuilles d'exercices, livres) est autorisé. L'usage des appareils électroniques est interdit. \medbreak Durée : 1h30 %Barème \emph{indicatif} : 8 points par exercices \ifcorrige %Ce corrigé comporte 10 pages (page de garde incluse) \else %Cet énoncé comporte 4 pages (page de garde incluse) \fi \pagebreak % % % \exercice Dans cet exercice, on pose $\Sigma = \{a,b\}$. On s'intéresse au langage $L$ formé des mots (éléments de $\Sigma^*$) ayant $aa$ ou $bb$ comme facteur (c'est-à-dire contenant deux $a$ consécutifs, ou bien deux $b$ consécutifs, ou bien deux $c$ consécutifs), ainsi qu'à son complémentaire $M := \Sigma^* \setminus L$. (1) Donner une expression rationnelle dénotant $L$. \begin{corrige} Le langage des mots contenant deux $a$ consécutifs est dénoté par l'expression rationnelle $(a|b){*}\,aa\,(a|b){*}$, et celui des mots contenant deux $b$ consécutifs par $(a|b){*}\,bb\,(a|b){*}$. On peut donc proposer l'expression rationnelle $(a|b){*}\,aa\,(a|b){*} \; | \; (a|b){*}\,bb\,(a|b){*}$ ou encore, si on préfère, $(a|b){*}\,(aa|bb)\,(a|b){*}$. \end{corrige} (2) Indépendamment de la question (1), expliquer brièvement pourquoi l'automate $\mathscr{A}_2$ suivant reconnaît le langage $L$ : \begin{center} \begin{tikzpicture}[>=latex,line join=bevel,automaton] \node (S) at (0bp,0bp) [draw,circle,state,initial] {$S$}; \node (A) at (70bp,35bp) [draw,circle,state] {$A$}; \node (B) at (70bp,-35bp) [draw,circle,state] {$B$}; \node (T) at (140bp,0bp) [draw,circle,state,final] {$T$}; \draw [->] (S) to[loop above] node[auto] {$a,b$} (S); \draw [->] (S) -- node[auto,near end] {$a$} (A); \draw [->] (S) -- node[auto] {$b$} (B); \draw [->] (T) to[loop above] node[auto] {$a,b$} (T); \draw [->] (A) -- node[auto,near start] {$a$} (T); \draw [->] (B) -- node[auto] {$b$} (T); \end{tikzpicture} \end{center} De quelle sorte d'automate s'agit-il ? \begin{corrige} Un chemin de l'unique état initial $S$ à l'unique état final $T$ de $\mathscr{A}_2$ doit passer soit par l'état $A$ soit par l'état $B$, donc la lecture de ses étiquettes contient le facteur $aa$ (correspondant aux transitions $S\to A$ et $A\to T$) ou $bb$ ; et réciproquement, un mot contenant le facteur $aa$ ou $bb$ peut se lire en suivant un chemin de $S$ à $T$ dans l'automate (en plaçant le facteur $aa$ au niveau des transitions $S\to A$ et $A\to T$ ou de façon analogue pour $bb$). Il s'agit là d'un automate non déterministe (l'état $S$ a plusieurs transitions sortantes étiquetées par $a$), mais sans transitions spontanées ou en abrégé, NFA. \end{corrige} (3) Déterminiser (si nécessaire) l'automate $\mathscr{A}_2$ représenté en (2) ; on appellera $\mathscr{A}_3$ l'automate résultant. \begin{corrige} En notant $S$, $SA$, $SB$, $SAT$ et $SBT$ les états de l'automate déterministe $\mathscr{A}_3$ qui correspondent aux ensembles d'états de l'automate $\mathscr{A}_2$ donnés par les lettres en question, la déterminisation conduit à l'automate $\mathscr{A}_3$ suivant : \begin{center} \begin{tikzpicture}[>=latex,line join=bevel,automaton] \node (S) at (0bp,0bp) [draw,circle,state,initial] {$S$}; \node (SA) at (70bp,35bp) [draw,circle,state] {$SA$}; \node (SB) at (70bp,-35bp) [draw,circle,state] {$SB$}; \node (SAT) at (140bp,35bp) [draw,circle,state,final] {$SAT$}; \node (SBT) at (140bp,-35bp) [draw,circle,state,final] {$SBT$}; \draw [->] (S) -- node[auto,near end] {$a$} (SA); \draw [->] (S) -- node[auto,below] {$b$} (SB); \draw [->] (SA) to[out=300,in=60] node[auto] {$b$} (SB); \draw [->] (SB) to[out=120,in=240] node[auto] {$a$} (SA); \draw [->] (SA) -- node[auto] {$a$} (SAT); \draw [->] (SB) -- node[auto,below] {$b$} (SBT); \draw [->] (SAT) to[out=300,in=60] node[auto] {$b$} (SBT); \draw [->] (SBT) to[out=120,in=240] node[auto] {$a$} (SAT); \draw [->] (SAT) to[loop above] node[auto] {$a$} (SAT); \draw [->] (SBT) to[loop below] node[auto] {$b$} (SBT); \end{tikzpicture} \end{center} \vskip-\baselineskip\vskip-1ex\strut \end{corrige} (4) Minimiser (si nécessaire) l'automate $\mathscr{A}_3$ obtenu en (3) ; on appellera $\mathscr{A}_4$ l'automate minimal (=canonique) résultant. \begin{corrige} On part bein d'un automate $\mathscr{A}_3$ déterministe complet sans état inaccessible. La première étape de l'algorithme de minimisation sépare deux classes d'états : $S,SA,SB$ (non finaux) d'une part et $SAT,SBT$ de l'autre. Ensuite on sépare $S$ et $SA$ et $SB$ (car le premier ne conduit qu'à des états non finaux, le second conduit à des états finaux par la transition étiquetée $a$, et le troisième conduit à des états finaux par la transition étiquetée $b$). On obtient finalement un automate $\mathscr{A}_4$ à quatre états, qu'on peut appeler $S,SA,SB,U$ où $U$ est la classe de $SAT$ et $SBT$ : \begin{center} \begin{tikzpicture}[>=latex,line join=bevel,automaton] \node (S) at (0bp,0bp) [draw,circle,state,initial] {$S$}; \node (SA) at (70bp,35bp) [draw,circle,state] {$SA$}; \node (SB) at (70bp,-35bp) [draw,circle,state] {$SB$}; \node (U) at (140bp,0bp) [draw,circle,state,final] {$U$}; \draw [->] (S) -- node[auto,near end] {$a$} (SA); \draw [->] (S) -- node[auto,below] {$b$} (SB); \draw [->] (SA) to[out=300,in=60] node[auto] {$b$} (SB); \draw [->] (SB) to[out=120,in=240] node[auto] {$a$} (SA); \draw [->] (SA) -- node[auto] {$a$} (U); \draw [->] (SB) -- node[auto,below] {$b$} (U); \draw [->] (U) to[loop above] node[auto] {$a,b$} (U); \end{tikzpicture} \end{center} \vskip-\baselineskip\vskip-1ex\strut \end{corrige} (5) Construire un automate $\mathscr{A}_5$ reconnaissant le langage $M$ complémentaire de $L$. \begin{corrige} On obtient $\mathscr{A}_5$ en échangeant états finaux et non finaux dans $\mathscr{A}_4$, c'est-à-dire l'automate $\mathscr{A}_5$ suivant : \begin{center} \begin{tikzpicture}[>=latex,line join=bevel,automaton] \node (S) at (0bp,0bp) [draw,circle,state,initial,final,accepting below] {$S$}; \node (SA) at (70bp,35bp) [draw,circle,state,final] {$SA$}; \node (SB) at (70bp,-35bp) [draw,circle,state,final] {$SB$}; \node (U) at (140bp,0bp) [draw,circle,state] {$U$}; \draw [->] (S) -- node[auto,near end] {$a$} (SA); \draw [->] (S) -- node[auto,below] {$b$} (SB); \draw [->] (SA) to[out=300,in=60] node[auto] {$b$} (SB); \draw [->] (SB) to[out=120,in=240] node[auto] {$a$} (SA); \draw [->] (SA) -- node[auto] {$a$} (U); \draw [->] (SB) -- node[auto,below,near end] {$b$} (U); \draw [->] (U) to[loop above] node[auto] {$a,b$} (U); \end{tikzpicture} \end{center} (L'état $U$ est maintenant un puits.) \end{corrige} (6) En appliquant à $\mathscr{A}_5$ la méthode d'élimination des états, déterminer une expression rationnelle dénotant le langage $M$. \begin{corrige} On va manipuler des automates finis à transitions étiquetées par des expressions rationnelles (ou « RNFA »). Dans un premier temps, on donne à l'automate un unique état final $F$ en faisant pointer vers lui une transition spontanée (i.e., étiquetée par $\underline{\varepsilon}$) depuis tout état qui était final. L'état $U$ peut être éliminé d'emblée puisqu'il est inutile (il n'est pas co-accessible : c'est un puits !). On a donc affaire à l'automate suivant \begin{center} \begin{tikzpicture}[>=latex,line join=bevel,automaton] \node (S) at (0bp,0bp) [draw,circle,state,initial] {$S$}; \node (SA) at (70bp,35bp) [draw,circle,state] {$SA$}; \node (SB) at (70bp,-35bp) [draw,circle,state] {$SB$}; \node (F) at (140bp,0bp) [draw,circle,state,final] {$F$}; \draw [->] (S) -- node[auto,near end] {$a$} (SA); \draw [->] (S) -- node[auto,below] {$b$} (SB); \draw [->] (SA) to[out=300,in=60] node[auto] {$b$} (SB); \draw [->] (SB) to[out=120,in=240] node[auto] {$a$} (SA); \draw [->] (SA) -- node[auto] {$\underline{\varepsilon}$} (F); \draw [->] (SB) -- node[auto,below,near end] {$\underline{\varepsilon}$} (F); \draw [->] (S) to[out=270,in=90] (0,-30bp) to[out=270,in=270] node[auto,below] {$\underline{\varepsilon}$} (140bp,-30bp) to[in=270,out=90] (F); \end{tikzpicture} \end{center} On élimine maintenant l'état $SB$ : \begin{center} \begin{tikzpicture}[>=latex,line join=bevel,automaton] \node (S) at (0bp,0bp) [draw,circle,state,initial] {$S$}; \node (SA) at (70bp,35bp) [draw,circle,state] {$SA$}; \node (F) at (140bp,0bp) [draw,circle,state,final] {$F$}; \draw [->] (S) -- node[auto,near end] {$a|ba$} (SA); \draw [->] (SA) -- node[auto] {$\underline{\varepsilon}|b$} (F); \draw [->] (S) to[out=270,in=270] node[auto,below] {$\underline{\varepsilon}|b$} (F); \draw [->] (SA) to[loop below] node[auto] {$ba$} (SA); \end{tikzpicture} \end{center} Et l'élimination de l'état $SA$ conduit à l'expression rationnelle $\underline{\varepsilon}\,|\,b\,|\penalty0\,(a|ba)(ba){*}(\underline{\varepsilon}|b)$ (il y a bien sûr toutes sortes d'autres expressions rationnelles équivalentes : par exemple, on peut la réécrire comme $\underline{\varepsilon}\,|\,b\,|\penalty0\,(\varepsilon|b)a(ba){*}(\underline{\varepsilon}|b)$ ou encore comme $(\varepsilon|b)(\underline{\varepsilon}|a(ba){*}(\underline{\varepsilon}|b))$ ; si on avait éliminé l'état $SA$ en premier, on serait plutôt tombé sur $\underline{\varepsilon}\,|\,a\,|\penalty0\,(b|ab)(ab){*}(\underline{\varepsilon}|a)$, et ainsi de suite). \end{corrige} % % % \exercice On considère la grammaire hors-contexte $G$ d'axiome $S$ et de nonterminaux $N = \{S, T, U, V\}$ sur l'alphabet $\Sigma = \{{\#},{@},{(},{)}, x, y, z\}$ (soit $7$ lettres) donnée par \[ \begin{aligned} S &\rightarrow T \;|\; S\mathbin{\#}T\\ T &\rightarrow U \;|\; U\mathbin{@}T\\ U &\rightarrow V \;|\; (\,S\,)\\ V &\rightarrow x \;|\; y \;|\; z\\ \end{aligned} \] (On pourra imaginer que $\#$ et $@$ sont deux opérations binaires, les parenthèses servent comme on s'y attend, et $x,y,z$ sont trois choses auxquelles on peut vouloir appliquer ces opérations.) La grammaire en question est inambiguë (on ne demande pas de le démontrer). (1) Donner les arbres d'analyse des mots suivants : (a) $x\mathbin{\#}y\mathbin{\#}z$, (b) $x\mathbin{\#}y\mathbin{@}z$, (c) $x\mathbin{@}y\mathbin{\#}z$, (d) $x\mathbin{@}y\mathbin{@}z$, (e) $(x\mathbin{\#}y)\mathbin{@}z$. (2) En considérant que $(w)$ a le même effet / la même valeur que $w$ : (a) Quelle opération parmi $\#$ et $@$ est prioritaire\footnote{On dit qu'une opération binaire $\boxtimes$ est \emph{prioritaire} sur $\boxplus$ lorsque « $u\boxtimes v\boxplus w$ » se comprend comme « $(u\boxtimes v)\boxplus w$ » et « $u\boxplus v\boxtimes w$ » comme « $u\boxplus (v\boxtimes w)$ ».} sur l'autre ? (b) L'opération $\#$ s'associe-t-elle\footnote{On dit qu'une opération binaire $\boxdot$ \emph{s'associe à gauche} lorsque « $u\boxdot v\boxdot w$ » se comprend comme « $(u\boxdot v)\boxdot w$ », et \emph{s'associe à droite} lorsque « $u\boxdot v\boxdot w$ » se comprend comme « $u\boxdot (v\boxdot w)$ ».} à gauche ou à droite ? (c) L'opération $@$ s'associe-t-elle à gauche ou à droite ? % % % \exercice (On pourra si on le souhaite remplacer $\mathbb{N}$ partout dans cet exercice par l'ensemble $\Sigma^*$ des mots sur un alphabet $\Sigma$ [fini] non vide fixé quelconque.) Dans cet exercice, on appelle « langage » une partie de $\mathbb{N}$ (cf. le paragraphe précédent). On dira que deux langages $L,M$ disjoints (c'est-à-dire $L\cap M = \varnothing$) sont \emph{calculablement séparables} lorsqu'il existe un $E$ décidable tel que $L \subseteq E$ et $M \subseteq (\mathbb{N}\setminus E)$ (où $\mathbb{N}\setminus E$ désigne le complémentaire de $E$) ; dans le cas contraire, on les dit \emph{calculablement inséparables}. (1) Expliquer pourquoi deux langages $L,M$ disjoints sont calculablement séparables si et seulement si il existe un algorithme qui, prenant en entrée un élément $x$ de $\mathbb{N}$ : \begin{itemize} \item termine toujours en temps fini, \item répond « vrai » si $x\in L$ et « faux » si $x \in M$ (rien n'est imposé si $x\not\in L\cup M$). \end{itemize} (2) Expliquer pourquoi deux langages $L,M$ disjoints sont calculablement séparables si et seulement si il existe deux langages $E,F$ \emph{décidables disjoints} tels que $L \subseteq E$ et $M \subseteq F$. (3) Deux langages décidables disjoints peuvent-ils être calculablement inséparables ? On cherche maintenant à montrer qu'il existe deux langages $L,M$ \emph{semi-décidables} disjoints et calculablement inséparables. Pour cela, appelle $L$ l'ensemble des couples\footnote{Pour être rigoureux, on a fixé un codage permettant de représenter les programmes $e$, les entrées $x$ à ces programmes, et les couples $(e,x)$ comme des éléments de $\mathbb{N}$. Il n'est pas nécessaire de faire apparaître ce codage dans la description des algorithmes proposés, qui peut rester informelle.} $(e,x)$ formés d'un programme (=algorithme) $e$ et d'une entrée $x$, tels que l'exécution du programme $e$ sur l'entrée $x$ termine en temps fini et renvoie la valeur $1$ (ce qui peut se noter $\varphi_e(x) = 1$) ; et $M$ le langage défini de la même manière mais avec la valeur $2$, i.e., $\varphi_e(x) = 2$. (Ici, $1$ et $2$ peuvent être remplacés deux éléments distincts quelconques de $\mathbb{N}$ : si on a souhaité remplacer $\mathbb{N}$ par $\Sigma^*$, on peut prendre deux mots distincts quelconques, par exemple $a$ et $aa$.) (4) Pourquoi $L$ et $M$ sont-ils disjoints ? (5) Pourquoi $L$ et $M$ sont-ils semi-décidables ? (6) En calquant la démonstration du théorème de Turing sur l'indécidabilité du problème de l'arrêt, montrer qu'il n'existe aucun algorithme qui, prenant en entrée un couple $(e,x)$, termine toujours en temps fini et répond « vrai » si $(e,x)\in L$ et « faux » si $(e,x) \in M$ (indication : si un tel algorithme existait, on pourrait s'en servir pour faire le contraire de ce qu'il prédit). (7) Conclure. % % % \end{document}