%% This is a LaTeX document.  Hey, Emacs, -*- latex -*- , get it?
\documentclass[12pt,a4paper]{article}
\usepackage[francais]{babel}
\usepackage[utf8]{inputenc}
\usepackage[T1]{fontenc}
%\usepackage{ucs}
\usepackage{times}
% A tribute to the worthy AMS:
\usepackage{amsmath}
\usepackage{amsfonts}
\usepackage{amssymb}
\usepackage{amsthm}
%
\usepackage{mathrsfs}
\usepackage{wasysym}
\usepackage{url}
%
\usepackage{graphics}
\usepackage[usenames,dvipsnames]{xcolor}
\usepackage{tikz}
\usetikzlibrary{arrows,automata,positioning}
\usepackage{hyperref}
%
\theoremstyle{definition}
\newtheorem{comcnt}{Tout}
\newcommand\thingy{%
\refstepcounter{comcnt}\smallbreak\noindent\textbf{\thecomcnt.} }
\newcommand\exercice{%
\refstepcounter{comcnt}\bigbreak\noindent\textbf{Exercice~\thecomcnt.}}
\renewcommand{\qedsymbol}{\smiley}
%
\DeclareUnicodeCharacter{00A0}{~}
\DeclareUnicodeCharacter{03B5}{$\varepsilon$}
%
\DeclareMathSymbol{\tiret}{\mathord}{operators}{"7C}
\DeclareMathSymbol{\traitdunion}{\mathord}{operators}{"2D}
%
%
\DeclareFontFamily{U}{manual}{} 
\DeclareFontShape{U}{manual}{m}{n}{ <->  manfnt }{}
\newcommand{\manfntsymbol}[1]{%
    {\fontencoding{U}\fontfamily{manual}\selectfont\symbol{#1}}}
\newcommand{\dbend}{\manfntsymbol{127}}% Z-shaped
\newcommand{\danger}{\noindent\hangindent\parindent\hangafter=-2%
  \hbox to0pt{\hskip-\hangindent\dbend\hfill}}
%
\newcommand{\spaceout}{\hskip1emplus2emminus.5em}
\newif\ifcorrige
\corrigetrue
\newenvironment{corrige}%
{\ifcorrige\relax\else\setbox0=\vbox\bgroup\fi%
\smallbreak\noindent{\underbar{\textit{Corrigé.}}\quad}}
{{\hbox{}\nobreak\hfill\checkmark}%
\ifcorrige\relax\else\egroup\fi\par}
\newenvironment{commentaire}%
{\ifcorrige\relax\else\setbox0=\vbox\bgroup\fi%
\smallbreak\noindent{\underbar{\textit{Commentaires.}}\quad}}
{{\hbox{}\nobreak\hfill\maltese}%
\ifcorrige\relax\else\egroup\fi\par}
%
%
% NOTE: compile dot files with
% dot2tex --figonly -f tikz --tikzedgelabels --graphstyle=automaton file.dot  > file.tex
\tikzstyle{automaton}=[>=stealth',initial text={},thick,every loop/.style={min distance=7mm,looseness=5}]
\tikzstyle{state}=[]
\tikzstyle{final}=[accepting by arrow]
%
%
%
\begin{document}
\ifcorrige
\title{INF105\\Contrôle de connaissances — Corrigé\\{\normalsize Théorie des langages}}
\else
\title{INF105\\Contrôle de connaissances\\{\normalsize Théorie des langages}}
\fi
\author{}
\date{6 février 2018}
\maketitle

%% {\footnotesize
%% \immediate\write18{sh ./vc > vcline.tex}
%% \begin{center}
%% Git: \input{vcline.tex}
%% \end{center}
%% \immediate\write18{echo ' (stale)' >> vcline.tex}
%% \par}

\pretolerance=8000
\tolerance=50000

\vskip1truein\relax

\noindent\textbf{Consignes.}

Les exercices sont totalement indépendants.  Ils pourront être traités
dans un ordre quelconque, mais on demande de faire apparaître de façon
très visible dans les copies où commence chaque exercice.

\medbreak

Le sujet étant long pour le temps imparti, il ne sera pas nécessaire
de traiter toutes les questions pour obtenir la totalité des points.

\medbreak

L'usage de tous les documents (notes de cours manuscrites ou
imprimées, feuilles d'exercices, livres) est autorisé.

L'usage des appareils électroniques est interdit.

\medbreak

Durée : 1h30

%Barème \emph{indicatif} : 8 points par exercices

\ifcorrige
%Ce corrigé comporte 10 pages (page de garde incluse)
\else
%Cet énoncé comporte 4 pages (page de garde incluse)
\fi

\pagebreak


%
%
%

\exercice

Dans cet exercice, on pose $\Sigma = \{a,b\}$.  On s'intéresse au
langage $L$ formé des mots (éléments de $\Sigma^*$) ayant $aa$ ou $bb$
comme facteur (c'est-à-dire contenant deux $a$ consécutifs, ou bien
deux $b$ consécutifs, ou bien deux $c$ consécutifs), ainsi qu'à son
complémentaire $M := \Sigma^* \setminus L$.

(1) Donner une expression rationnelle dénotant $L$.

\begin{corrige}
Le langage des mots contenant deux $a$ consécutifs est dénoté par
l'expression rationnelle $(a|b){*}\,aa\,(a|b){*}$, et celui des mots
contenant deux $b$ consécutifs par $(a|b){*}\,bb\,(a|b){*}$.  On peut
donc proposer l'expression rationnelle $(a|b){*}\,aa\,(a|b){*} \; | \;
(a|b){*}\,bb\,(a|b){*}$ ou encore, si on préfère,
$(a|b){*}\,(aa|bb)\,(a|b){*}$.
\end{corrige}

(2) Indépendamment de la question (1), expliquer brièvement pourquoi
l'automate $\mathscr{A}_2$ suivant reconnaît le langage $L$ :

\begin{center}
\begin{tikzpicture}[>=latex,line join=bevel,automaton]
\node (S) at (0bp,0bp) [draw,circle,state,initial] {$S$};
\node (A) at (70bp,35bp) [draw,circle,state] {$A$};
\node (B) at (70bp,-35bp) [draw,circle,state] {$B$};
\node (T) at (140bp,0bp) [draw,circle,state,final] {$T$};
\draw [->] (S) to[loop above] node[auto] {$a,b$} (S);
\draw [->] (S) -- node[auto,near end] {$a$} (A);
\draw [->] (S) -- node[auto] {$b$} (B);
\draw [->] (T) to[loop above] node[auto] {$a,b$} (T);
\draw [->] (A) -- node[auto,near start] {$a$} (T);
\draw [->] (B) -- node[auto] {$b$} (T);
\end{tikzpicture}
\end{center}

De quelle sorte d'automate s'agit-il ?

\begin{corrige}
Un chemin de l'unique état initial $S$ à l'unique état final $T$ de
$\mathscr{A}_2$ doit passer soit par l'état $A$ soit par l'état $B$,
donc la lecture de ses étiquettes contient le facteur $aa$
(correspondant aux transitions $S\to A$ et $A\to T$) ou $bb$ ; et
réciproquement, un mot contenant le facteur $aa$ ou $bb$ peut se lire
en suivant un chemin de $S$ à $T$ dans l'automate (en plaçant le
facteur $aa$ au niveau des transitions $S\to A$ et $A\to T$ ou de
façon analogue pour $bb$).

Il s'agit là d'un automate non déterministe (l'état $S$ a plusieurs
transitions sortantes étiquetées par $a$), mais sans transitions
spontanées ou en abrégé, NFA.
\end{corrige}

(3) Déterminiser (si nécessaire) l'automate $\mathscr{A}_2$ représenté
en (2) ; on appellera $\mathscr{A}_3$ l'automate résultant.

\begin{corrige}
En notant $S$, $SA$, $SB$, $SAT$ et $SBT$ les états de l'automate
déterministe $\mathscr{A}_3$ qui correspondent aux ensembles d'états
de l'automate $\mathscr{A}_2$ donnés par les lettres en question, la
déterminisation conduit à l'automate $\mathscr{A}_3$ suivant :
\begin{center}
\begin{tikzpicture}[>=latex,line join=bevel,automaton]
\node (S) at (0bp,0bp) [draw,circle,state,initial] {$S$};
\node (SA) at (70bp,35bp) [draw,circle,state] {$SA$};
\node (SB) at (70bp,-35bp) [draw,circle,state] {$SB$};
\node (SAT) at (140bp,35bp) [draw,circle,state,final] {$SAT$};
\node (SBT) at (140bp,-35bp) [draw,circle,state,final] {$SBT$};
\draw [->] (S) -- node[auto,near end] {$a$} (SA);
\draw [->] (S) -- node[auto,below] {$b$} (SB);
\draw [->] (SA) to[out=300,in=60] node[auto] {$b$} (SB);
\draw [->] (SB) to[out=120,in=240] node[auto] {$a$} (SA);
\draw [->] (SA) -- node[auto] {$a$} (SAT);
\draw [->] (SB) -- node[auto,below] {$b$} (SBT);
\draw [->] (SAT) to[out=300,in=60] node[auto] {$b$} (SBT);
\draw [->] (SBT) to[out=120,in=240] node[auto] {$a$} (SAT);
\draw [->] (SAT) to[loop above] node[auto] {$a$} (SAT);
\draw [->] (SBT) to[loop below] node[auto] {$b$} (SBT);
\end{tikzpicture}
\end{center}
\vskip-\baselineskip\vskip-1ex\strut
\end{corrige}

(4) Minimiser (si nécessaire) l'automate $\mathscr{A}_3$ obtenu
en (3) ; on appellera $\mathscr{A}_4$ l'automate minimal (=canonique)
résultant.

\begin{corrige}
On part bein d'un automate $\mathscr{A}_3$ déterministe complet sans
état inaccessible.  La première étape de l'algorithme de minimisation
sépare deux classes d'états : $S,SA,SB$ (non finaux) d'une part et
$SAT,SBT$ de l'autre.  Ensuite on sépare $S$ et $SA$ et $SB$ (car le
premier ne conduit qu'à des états non finaux, le second conduit à des
états finaux par la transition étiquetée $a$, et le troisième conduit
à des états finaux par la transition étiquetée $b$).  On obtient
finalement un automate $\mathscr{A}_4$ à quatre états, qu'on peut
appeler $S,SA,SB,U$ où $U$ est la classe de $SAT$ et $SBT$ :
\begin{center}
\begin{tikzpicture}[>=latex,line join=bevel,automaton]
\node (S) at (0bp,0bp) [draw,circle,state,initial] {$S$};
\node (SA) at (70bp,35bp) [draw,circle,state] {$SA$};
\node (SB) at (70bp,-35bp) [draw,circle,state] {$SB$};
\node (U) at (140bp,0bp) [draw,circle,state,final] {$U$};
\draw [->] (S) -- node[auto,near end] {$a$} (SA);
\draw [->] (S) -- node[auto,below] {$b$} (SB);
\draw [->] (SA) to[out=300,in=60] node[auto] {$b$} (SB);
\draw [->] (SB) to[out=120,in=240] node[auto] {$a$} (SA);
\draw [->] (SA) -- node[auto] {$a$} (U);
\draw [->] (SB) -- node[auto,below] {$b$} (U);
\draw [->] (U) to[loop above] node[auto] {$a,b$} (U);
\end{tikzpicture}
\end{center}
\vskip-\baselineskip\vskip-1ex\strut
\end{corrige}

(5) Construire un automate $\mathscr{A}_5$ reconnaissant le
langage $M$ complémentaire de $L$.

\begin{corrige}
On obtient $\mathscr{A}_5$ en échangeant états finaux et non finaux
dans $\mathscr{A}_4$, c'est-à-dire l'automate $\mathscr{A}_5$
suivant :
\begin{center}
\begin{tikzpicture}[>=latex,line join=bevel,automaton]
\node (S) at (0bp,0bp) [draw,circle,state,initial,final,accepting below] {$S$};
\node (SA) at (70bp,35bp) [draw,circle,state,final] {$SA$};
\node (SB) at (70bp,-35bp) [draw,circle,state,final] {$SB$};
\node (U) at (140bp,0bp) [draw,circle,state] {$U$};
\draw [->] (S) -- node[auto,near end] {$a$} (SA);
\draw [->] (S) -- node[auto,below] {$b$} (SB);
\draw [->] (SA) to[out=300,in=60] node[auto] {$b$} (SB);
\draw [->] (SB) to[out=120,in=240] node[auto] {$a$} (SA);
\draw [->] (SA) -- node[auto] {$a$} (U);
\draw [->] (SB) -- node[auto,below,near end] {$b$} (U);
\draw [->] (U) to[loop above] node[auto] {$a,b$} (U);
\end{tikzpicture}
\end{center}
(L'état $U$ est maintenant un puits.)
\end{corrige}

(6) En appliquant à $\mathscr{A}_5$ la méthode d'élimination des
états, déterminer une expression rationnelle dénotant le langage $M$.

\begin{corrige}
On va manipuler des automates finis à transitions étiquetées par des
expressions rationnelles (ou « RNFA »).  Dans un premier temps, on
donne à l'automate un unique état final $F$ en faisant pointer vers
lui une transition spontanée (i.e., étiquetée
par $\underline{\varepsilon}$) depuis tout état qui était final.
L'état $U$ peut être éliminé d'emblée puisqu'il est inutile (il n'est
pas co-accessible : c'est un puits !).  On a donc affaire à l'automate
suivant
\begin{center}
\begin{tikzpicture}[>=latex,line join=bevel,automaton]
\node (S) at (0bp,0bp) [draw,circle,state,initial] {$S$};
\node (SA) at (70bp,35bp) [draw,circle,state] {$SA$};
\node (SB) at (70bp,-35bp) [draw,circle,state] {$SB$};
\node (F) at (140bp,0bp) [draw,circle,state,final] {$F$};
\draw [->] (S) -- node[auto,near end] {$a$} (SA);
\draw [->] (S) -- node[auto,below] {$b$} (SB);
\draw [->] (SA) to[out=300,in=60] node[auto] {$b$} (SB);
\draw [->] (SB) to[out=120,in=240] node[auto] {$a$} (SA);
\draw [->] (SA) -- node[auto] {$\underline{\varepsilon}$} (F);
\draw [->] (SB) -- node[auto,below,near end] {$\underline{\varepsilon}$} (F);
\draw [->] (S) to[out=270,in=90] (0,-30bp) to[out=270,in=270] node[auto,below] {$\underline{\varepsilon}$} (140bp,-30bp) to[in=270,out=90] (F);
\end{tikzpicture}
\end{center}
On élimine maintenant l'état $SB$ :
\begin{center}
\begin{tikzpicture}[>=latex,line join=bevel,automaton]
\node (S) at (0bp,0bp) [draw,circle,state,initial] {$S$};
\node (SA) at (70bp,35bp) [draw,circle,state] {$SA$};
\node (F) at (140bp,0bp) [draw,circle,state,final] {$F$};
\draw [->] (S) -- node[auto,near end] {$a|ba$} (SA);
\draw [->] (SA) -- node[auto] {$\underline{\varepsilon}|b$} (F);
\draw [->] (S) to[out=270,in=270] node[auto,below] {$\underline{\varepsilon}|b$} (F);
\draw [->] (SA) to[loop below] node[auto] {$ba$} (SA);
\end{tikzpicture}
\end{center}
Et l'élimination de l'état $SA$ conduit à l'expression rationnelle
$\underline{\varepsilon}\,|\,b\,|\penalty0\,(a|ba)(ba){*}(\underline{\varepsilon}|b)$
(il y a bien sûr toutes sortes d'autres expressions rationnelles
équivalentes : par exemple, on peut la réécrire comme
$\underline{\varepsilon}\,|\,b\,|\penalty0\,(\varepsilon|b)a(ba){*}(\underline{\varepsilon}|b)$
ou encore comme
$(\varepsilon|b)(\underline{\varepsilon}|a(ba){*}(\underline{\varepsilon}|b))$ ;
si on avait éliminé l'état $SA$ en premier, on serait plutôt tombé sur
$\underline{\varepsilon}\,|\,a\,|\penalty0\,(b|ab)(ab){*}(\underline{\varepsilon}|a)$,
et ainsi de suite).
\end{corrige}


%
%
%

\exercice

On considère la grammaire hors-contexte $G$ d'axiome $S$ et de
nonterminaux $N = \{S, T, U, V\}$ sur l'alphabet $\Sigma =
\{{\#},{@},{(},{)}, x, y, z\}$ (soit $7$ lettres) donnée par
\[
\begin{aligned}
S &\rightarrow T \;|\; S\mathbin{\#}T\\
T &\rightarrow U \;|\; U\mathbin{@}T\\
U &\rightarrow V \;|\; (\,S\,)\\
V &\rightarrow x \;|\; y \;|\; z\\
\end{aligned}
\]
(On pourra imaginer que $\#$ et $@$ sont deux opérations binaires, les
parenthèses servent comme on s'y attend, et $x,y,z$ sont trois choses
auxquelles on peut vouloir appliquer ces opérations.)

La grammaire en question est inambiguë (on ne demande pas de le
démontrer).

(1) Donner les arbres d'analyse des mots suivants :
(a) $x\mathbin{\#}y\mathbin{\#}z$, (b) $x\mathbin{\#}y\mathbin{@}z$,
(c) $x\mathbin{@}y\mathbin{\#}z$, (d) $x\mathbin{@}y\mathbin{@}z$,
(e) $(x\mathbin{\#}y)\mathbin{@}z$.

(2) En considérant que $(w)$ a le même effet / la même valeur
que $w$ : (a) Quelle opération parmi $\#$ et $@$ est
prioritaire\footnote{On dit qu'une opération binaire $\boxtimes$ est
  \emph{prioritaire} sur $\boxplus$ lorsque « $u\boxtimes v\boxplus
  w$ » se comprend comme « $(u\boxtimes v)\boxplus w$ » et
  « $u\boxplus v\boxtimes w$ » comme « $u\boxplus (v\boxtimes w)$ ».}
sur l'autre ?  (b) L'opération $\#$ s'associe-t-elle\footnote{On dit
  qu'une opération binaire $\boxdot$ \emph{s'associe à gauche} lorsque
  « $u\boxdot v\boxdot w$ » se comprend comme « $(u\boxdot v)\boxdot
  w$ », et \emph{s'associe à droite} lorsque « $u\boxdot v\boxdot w$ »
  se comprend comme « $u\boxdot (v\boxdot w)$ ».} à gauche ou à
droite ?  (c) L'opération $@$ s'associe-t-elle à gauche ou à droite ?


%
%
%

\exercice

(On pourra si on le souhaite remplacer $\mathbb{N}$ partout dans cet
exercice par l'ensemble $\Sigma^*$ des mots sur un alphabet $\Sigma$
[fini] non vide fixé quelconque.)

Dans cet exercice, on appelle « langage » une partie de $\mathbb{N}$
(cf. le paragraphe précédent).  On dira que deux langages $L,M$
disjoints (c'est-à-dire $L\cap M = \varnothing$) sont
\emph{calculablement séparables} lorsqu'il existe un $E$ décidable tel
que $L \subseteq E$ et $M \subseteq (\mathbb{N}\setminus E)$ (où
$\mathbb{N}\setminus E$ désigne le complémentaire de $E$) ; dans le
cas contraire, on les dit \emph{calculablement inséparables}.

(1) Expliquer pourquoi deux langages $L,M$ disjoints sont
calculablement séparables si et seulement si il existe un algorithme
qui, prenant en entrée un élément $x$ de $\mathbb{N}$ :
\begin{itemize}
\item termine toujours en temps fini,
\item répond « vrai » si $x\in L$ et « faux » si $x \in M$ (rien n'est
  imposé si $x\not\in L\cup M$).
\end{itemize}

(2) Expliquer pourquoi deux langages $L,M$ disjoints sont
calculablement séparables si et seulement si il existe deux langages
$E,F$ \emph{décidables disjoints} tels que $L \subseteq E$ et $M
\subseteq F$.

(3) Deux langages décidables disjoints peuvent-ils être calculablement
inséparables ?

On cherche maintenant à montrer qu'il existe deux langages $L,M$
\emph{semi-décidables} disjoints et calculablement inséparables.

Pour cela, appelle $L$ l'ensemble des couples\footnote{Pour être
  rigoureux, on a fixé un codage permettant de représenter les
  programmes $e$, les entrées $x$ à ces programmes, et les couples
  $(e,x)$ comme des éléments de $\mathbb{N}$.  Il n'est pas nécessaire
  de faire apparaître ce codage dans la description des algorithmes
  proposés, qui peut rester informelle.} $(e,x)$ formés d'un programme
(=algorithme) $e$ et d'une entrée $x$, tels que l'exécution du
programme $e$ sur l'entrée $x$ termine en temps fini et renvoie la
valeur $1$ (ce qui peut se noter $\varphi_e(x) = 1$) ; et $M$ le
langage défini de la même manière mais avec la valeur $2$,
i.e., $\varphi_e(x) = 2$.  (Ici, $1$ et $2$ peuvent être remplacés
deux éléments distincts quelconques de $\mathbb{N}$ : si on a souhaité
remplacer $\mathbb{N}$ par $\Sigma^*$, on peut prendre deux mots
distincts quelconques, par exemple $a$ et $aa$.)

(4) Pourquoi $L$ et $M$ sont-ils disjoints ?

(5) Pourquoi $L$ et $M$ sont-ils semi-décidables ?

(6) En calquant la démonstration du théorème de Turing sur
l'indécidabilité du problème de l'arrêt, montrer qu'il n'existe aucun
algorithme qui, prenant en entrée un couple $(e,x)$, termine toujours
en temps fini et répond « vrai » si $(e,x)\in L$ et « faux » si $(e,x)
\in M$ (indication : si un tel algorithme existait, on pourrait s'en
servir pour faire le contraire de ce qu'il prédit).

(7) Conclure.


%
%
%
\end{document}