1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
|
%% This is a LaTeX document. Hey, Emacs, -*- latex -*- , get it?
\documentclass[12pt,a4paper]{article}
\usepackage[francais]{babel}
\usepackage[utf8]{inputenc}
\usepackage[T1]{fontenc}
%\usepackage{ucs}
\usepackage{times}
% A tribute to the worthy AMS:
\usepackage{amsmath}
\usepackage{amsfonts}
\usepackage{amssymb}
\usepackage{amsthm}
%
\usepackage{mathrsfs}
\usepackage{wasysym}
\usepackage{url}
%
\usepackage{graphics}
\usepackage[usenames,dvipsnames]{xcolor}
\usepackage{tikz}
\usetikzlibrary{arrows,automata,positioning}
\usepackage{hyperref}
%
\theoremstyle{definition}
\newtheorem{comcnt}{Tout}
\newcommand\thingy{%
\refstepcounter{comcnt}\smallskip\noindent\textbf{\thecomcnt.} }
\newcommand\exercice{%
\refstepcounter{comcnt}\bigskip\noindent\textbf{Exercice~\thecomcnt.}}
\renewcommand{\qedsymbol}{\smiley}
%
\DeclareUnicodeCharacter{00A0}{~}
\DeclareUnicodeCharacter{03B5}{$\varepsilon$}
%
\DeclareMathSymbol{\tiret}{\mathord}{operators}{"7C}
\DeclareMathSymbol{\traitdunion}{\mathord}{operators}{"2D}
%
%
\DeclareFontFamily{U}{manual}{}
\DeclareFontShape{U}{manual}{m}{n}{ <-> manfnt }{}
\newcommand{\manfntsymbol}[1]{%
{\fontencoding{U}\fontfamily{manual}\selectfont\symbol{#1}}}
\newcommand{\dbend}{\manfntsymbol{127}}% Z-shaped
\newcommand{\danger}{\noindent\hangindent\parindent\hangafter=-2%
\hbox to0pt{\hskip-\hangindent\dbend\hfill}}
%
\newcommand{\spaceout}{\hskip1emplus2emminus.5em}
\newif\ifcorrige
\corrigetrue
\newenvironment{corrige}%
{\ifcorrige\relax\else\setbox0=\vbox\bgroup\fi%
\smallbreak\noindent{\underbar{\textit{Corrigé.}}\quad}}
{{\hbox{}\nobreak\hfill\checkmark}%
\ifcorrige\par\smallbreak\else\egroup\par\fi}
\newenvironment{commentaire}%
{\ifcorrige\relax\else\setbox0=\vbox\bgroup\fi%
\smallbreak\noindent{\underbar{\textit{Commentaires.}}\quad}}
{{\hbox{}\nobreak\hfill\maltese}%
\ifcorrige\par\smallbreak\else\egroup\par\fi}
%
%
% NOTE: compile dot files with
% dot2tex --figonly -f tikz --tikzedgelabels --graphstyle=automaton file.dot > file.tex
\tikzstyle{automaton}=[>=stealth',initial text={},thick,every loop/.style={min distance=7mm,looseness=5}]
\tikzstyle{state}=[]
\tikzstyle{final}=[accepting by arrow]
%
%
%
\begin{document}
\ifcorrige
\title{INF105\\Contrôle de connaissances — Corrigé\\{\normalsize Théorie des langages}}
\else
\title{INF105\\Contrôle de connaissances\\{\normalsize Théorie des langages}}
\fi
\author{}
\date{6 février 2018}
\maketitle
%% {\footnotesize
%% \immediate\write18{sh ./vc > vcline.tex}
%% \begin{center}
%% Git: \input{vcline.tex}
%% \end{center}
%% \immediate\write18{echo ' (stale)' >> vcline.tex}
%% \par}
\pretolerance=8000
\tolerance=50000
\vskip1truein\relax
\noindent\textbf{Consignes.}
Les exercices sont totalement indépendants. Ils pourront être traités
dans un ordre quelconque, mais on demande de faire apparaître de façon
très visible dans les copies où commence chaque exercice.
\medbreak
L'usage de tous les documents (notes de cours manuscrites ou
imprimées, feuilles d'exercices, livres) est autorisé.
L'usage des appareils électroniques est interdit.
\medbreak
Durée : 1h30
Barème \emph{indicatif} : 7 points par exercice
\ifcorrige
Ce corrigé comporte 10 pages (page de garde incluse)
\else
Cet énoncé comporte 4 pages (page de garde incluse)
\fi
\pagebreak
%
%
%
\exercice
Dans cet exercice, on pose $\Sigma = \{a,b\}$. On s'intéresse au
langage $L$ formé des mots (éléments de $\Sigma^*$) ayant $aa$ ou $bb$
comme facteur (c'est-à-dire contenant deux $a$ consécutifs, ou bien
deux $b$ consécutifs), ainsi qu'à son
complémentaire $M := \Sigma^* \setminus L$.
(1) Donner une expression rationnelle dénotant $L$.
\begin{corrige}
Le langage des mots contenant deux $a$ consécutifs est dénoté par
l'expression rationnelle $(a|b){*}\,aa\,(a|b){*}$, et celui des mots
contenant deux $b$ consécutifs par $(a|b){*}\,bb\,(a|b){*}$. On peut
donc proposer l'expression rationnelle $(a|b){*}\,aa\,(a|b){*} \; | \;
(a|b){*}\,bb\,(a|b){*}$ ou encore, si on préfère,
$(a|b){*}\,(aa|bb)\,(a|b){*}$.
\end{corrige}
\begin{commentaire}
La principale erreur sur cette question a été d'écrire
$(a|b){*}\,aa|bb\,(a|b){*}$, en oubliant la priorité des opérations.
\end{commentaire}
(2) Indépendamment de la question (1), expliquer brièvement pourquoi
l'automate $\mathscr{A}_2$ suivant reconnaît le langage $L$ :
\begin{center}
\begin{tikzpicture}[>=latex,line join=bevel,automaton]
\node (S) at (0bp,0bp) [draw,circle,state,initial] {$S$};
\node (A) at (70bp,35bp) [draw,circle,state] {$A$};
\node (B) at (70bp,-35bp) [draw,circle,state] {$B$};
\node (T) at (140bp,0bp) [draw,circle,state,final] {$T$};
\draw [->] (S) to[loop above] node[auto] {$a,b$} (S);
\draw [->] (S) -- node[auto,near end] {$a$} (A);
\draw [->] (S) -- node[auto] {$b$} (B);
\draw [->] (T) to[loop above] node[auto] {$a,b$} (T);
\draw [->] (A) -- node[auto,near start] {$a$} (T);
\draw [->] (B) -- node[auto] {$b$} (T);
\end{tikzpicture}
\end{center}
De quelle sorte d'automate s'agit-il ?
\begin{corrige}
Un chemin de l'unique état initial $S$ à l'unique état final $T$ de
$\mathscr{A}_2$ doit passer soit par l'état $A$ soit par l'état $B$,
donc la lecture de ses étiquettes contient le facteur $aa$
(correspondant aux transitions $S\to A$ et $A\to T$) ou $bb$ ; et
réciproquement, un mot contenant le facteur $aa$ ou $bb$ peut se lire
en suivant un chemin de $S$ à $T$ dans l'automate (en plaçant le
facteur $aa$ au niveau des transitions $S\to A$ et $A\to T$ ou de
façon analogue pour $bb$).
Il s'agit là d'un automate non déterministe (l'état $S$ a plusieurs
transitions sortantes étiquetées par $a$), mais sans transitions
spontanées ou en abrégé, NFA.
\end{corrige}
(3) Déterminiser (si nécessaire) l'automate $\mathscr{A}_2$ représenté
en (2) ; on appellera $\mathscr{A}_3$ l'automate résultant.
\begin{corrige}
En notant $S$, $SA$, $SB$, $SAT$ et $SBT$ les états de l'automate
déterministe $\mathscr{A}_3$ qui correspondent aux ensembles d'états
de l'automate $\mathscr{A}_2$ donnés par les lettres en question, la
déterminisation conduit à l'automate $\mathscr{A}_3$ suivant :
\begin{center}
\begin{tikzpicture}[>=latex,line join=bevel,automaton]
\node (S) at (0bp,0bp) [draw,circle,state,initial] {$S$};
\node (SA) at (70bp,35bp) [draw,circle,state] {$SA$};
\node (SB) at (70bp,-35bp) [draw,circle,state] {$SB$};
\node (SAT) at (140bp,35bp) [draw,circle,state,final] {$SAT$};
\node (SBT) at (140bp,-35bp) [draw,circle,state,final] {$SBT$};
\draw [->] (S) -- node[auto,near end] {$a$} (SA);
\draw [->] (S) -- node[auto,below] {$b$} (SB);
\draw [->] (SA) to[out=300,in=60] node[auto] {$b$} (SB);
\draw [->] (SB) to[out=120,in=240] node[auto] {$a$} (SA);
\draw [->] (SA) -- node[auto] {$a$} (SAT);
\draw [->] (SB) -- node[auto,below] {$b$} (SBT);
\draw [->] (SAT) to[out=300,in=60] node[auto] {$b$} (SBT);
\draw [->] (SBT) to[out=120,in=240] node[auto] {$a$} (SAT);
\draw [->] (SAT) to[loop above] node[auto] {$a$} (SAT);
\draw [->] (SBT) to[loop below] node[auto] {$b$} (SBT);
\end{tikzpicture}
\end{center}
\vskip-\baselineskip\vskip-1ex\strut
\end{corrige}
\begin{commentaire}
Un nombre étonnant de copies aboutissent à des variations du même
résultat erroné sur cette question, à savoir faire pointer la
transition étiquetée $b$ partant de l'état $SA$ vers l'état $S$ plutôt
que vers $SB$ (et symétriquement, la transition étiquetée $a$ partant
de l'état $SB$ vers l'état $S$ plutôt que vers $SA$). Il serait
intéressant de comprendre d'où vient cette erreur.
\end{commentaire}
(4) Minimiser (si nécessaire) l'automate $\mathscr{A}_3$ obtenu
en (3) ; on appellera $\mathscr{A}_4$ l'automate minimal (=canonique)
résultant.
\begin{corrige}
On part bien d'un automate $\mathscr{A}_3$ déterministe complet sans
état inaccessible. La première étape de l'algorithme de minimisation
sépare deux classes d'états : $S,SA,SB$ (non finaux) d'une part et
$SAT,SBT$ de l'autre. Ensuite on sépare $S$ et $SA$ et $SB$ (car le
premier ne conduit qu'à des états non finaux, le deuxième conduit à un
état final par la transition étiquetée $a$, et le troisième conduit à
un état final par la transition étiquetée $b$). Les étapes suivantes
ne conduisent pas à d'autres séparations d'états. On obtient
finalement un automate $\mathscr{A}_4$ à quatre états, qu'on peut
appeler $S,SA,SB,U$ où $U$ est la classe de $SAT$ et $SBT$ :
\begin{center}
\begin{tikzpicture}[>=latex,line join=bevel,automaton]
\node (S) at (0bp,0bp) [draw,circle,state,initial] {$S$};
\node (SA) at (70bp,35bp) [draw,circle,state] {$SA$};
\node (SB) at (70bp,-35bp) [draw,circle,state] {$SB$};
\node (U) at (140bp,0bp) [draw,circle,state,final] {$U$};
\draw [->] (S) -- node[auto,near end] {$a$} (SA);
\draw [->] (S) -- node[auto,below] {$b$} (SB);
\draw [->] (SA) to[out=300,in=60] node[auto] {$b$} (SB);
\draw [->] (SB) to[out=120,in=240] node[auto] {$a$} (SA);
\draw [->] (SA) -- node[auto] {$a$} (U);
\draw [->] (SB) -- node[auto,below] {$b$} (U);
\draw [->] (U) to[loop above] node[auto] {$a,b$} (U);
\end{tikzpicture}
\end{center}
\vskip-\baselineskip\vskip-1ex\strut
\end{corrige}
(5) Construire un automate $\mathscr{A}_5$ reconnaissant le
langage $M$ complémentaire de $L$.
\begin{corrige}
On obtient $\mathscr{A}_5$ en échangeant états finaux et non finaux
dans $\mathscr{A}_4$, c'est-à-dire l'automate $\mathscr{A}_5$
suivant :
\begin{center}
\begin{tikzpicture}[>=latex,line join=bevel,automaton]
\node (S) at (0bp,0bp) [draw,circle,state,initial,final,accepting below] {$S$};
\node (SA) at (70bp,35bp) [draw,circle,state,final] {$SA$};
\node (SB) at (70bp,-35bp) [draw,circle,state,final] {$SB$};
\node (U) at (140bp,0bp) [draw,circle,state] {$U$};
\draw [->] (S) -- node[auto,near end] {$a$} (SA);
\draw [->] (S) -- node[auto,below] {$b$} (SB);
\draw [->] (SA) to[out=300,in=60] node[auto] {$b$} (SB);
\draw [->] (SB) to[out=120,in=240] node[auto] {$a$} (SA);
\draw [->] (SA) -- node[auto] {$a$} (U);
\draw [->] (SB) -- node[auto,below,near end] {$b$} (U);
\draw [->] (U) to[loop above] node[auto] {$a,b$} (U);
\end{tikzpicture}
\end{center}
(L'état $U$ est maintenant un puits.)
\end{corrige}
(6) En appliquant à $\mathscr{A}_5$ la méthode d'élimination des
états, déterminer une expression rationnelle dénotant le langage $M$.
\begin{corrige}
On va manipuler des automates finis à transitions étiquetées par des
expressions rationnelles (ou « RNFA »). Dans un premier temps, on
donne à l'automate un unique état final $F$ en faisant pointer vers
lui une transition spontanée (i.e., étiquetée
par $\underline{\varepsilon}$) depuis tout état qui était final.
L'état $U$ peut être éliminé d'emblée puisqu'il est inutile (il n'est
pas co-accessible : c'est un puits !). On a donc affaire à l'automate
suivant
\begin{center}
\begin{tikzpicture}[>=latex,line join=bevel,automaton]
\node (S) at (0bp,0bp) [draw,circle,state,initial] {$S$};
\node (SA) at (70bp,35bp) [draw,circle,state] {$SA$};
\node (SB) at (70bp,-35bp) [draw,circle,state] {$SB$};
\node (F) at (140bp,0bp) [draw,circle,state,final] {$F$};
\draw [->] (S) -- node[auto,near end] {$a$} (SA);
\draw [->] (S) -- node[auto,below] {$b$} (SB);
\draw [->] (SA) to[out=300,in=60] node[auto] {$b$} (SB);
\draw [->] (SB) to[out=120,in=240] node[auto] {$a$} (SA);
\draw [->] (SA) -- node[auto] {$\underline{\varepsilon}$} (F);
\draw [->] (SB) -- node[auto,below,near end] {$\underline{\varepsilon}$} (F);
\draw [->] (S) to[out=270,in=90] (0,-30bp) to[out=270,in=270] node[auto,below] {$\underline{\varepsilon}$} (140bp,-30bp) to[in=270,out=90] (F);
\end{tikzpicture}
\end{center}
On élimine maintenant l'état $SB$ :
\begin{center}
\begin{tikzpicture}[>=latex,line join=bevel,automaton]
\node (S) at (0bp,0bp) [draw,circle,state,initial] {$S$};
\node (SA) at (70bp,35bp) [draw,circle,state] {$SA$};
\node (F) at (140bp,0bp) [draw,circle,state,final] {$F$};
\draw [->] (S) -- node[auto,near end] {$a|ba$} (SA);
\draw [->] (SA) -- node[auto] {$\underline{\varepsilon}|b$} (F);
\draw [->] (S) to[out=270,in=270] node[auto,below] {$\underline{\varepsilon}|b$} (F);
\draw [->] (SA) to[loop below] node[auto] {$ba$} (SA);
\end{tikzpicture}
\end{center}
Et l'élimination de l'état $SA$ conduit à l'expression rationnelle
$\underline{\varepsilon}\,|\,b\,|\penalty0\,(a|ba)(ba){*}(\underline{\varepsilon}|b)$
(il y a bien sûr toutes sortes d'autres expressions rationnelles
équivalentes : par exemple, on peut la réécrire comme
$\underline{\varepsilon}\,|\,b\,|\penalty0\,(\varepsilon|b)a(ba){*}(\underline{\varepsilon}|b)$
ou encore comme
$(\varepsilon|b)(\underline{\varepsilon}|a(ba){*}(\underline{\varepsilon}|b))$ ;
si on avait éliminé l'état $SA$ en premier, on serait plutôt tombé sur
$\underline{\varepsilon}\,|\,a\,|\penalty0\,(b|ab)(ab){*}(\underline{\varepsilon}|a)$,
et ainsi de suite).
\end{corrige}
\begin{commentaire}
Cette question a donné lieu à très peu de réponses correctes.
Certains trichent et devinent l'expression rationnelle à trouver
(généralement en oubliant le mot vide et/ou les mots de longueur $1$)
au lieu d'appliquer l'algorithme d'élimination des états. Ceux qui
ont l'honnêteté de l'appliquer oublient souvent de se ramener à un
automate ayant un unique état initial (c'était déjà le cas) et un
unique état final (ce n'était pas le cas). Le choix de l'ordre
d'élimination des états est rarement réfléchi (notamment, même parmi
ceux qui appliquent correctement l'algorithme, beaucoup ne se rendent
pas compte qu'éliminer le puits peut se faire immédiatement).
\end{commentaire}
%
%
%
\exercice
On considère la grammaire hors-contexte $G$ d'axiome $S$ et de
nonterminaux $N = \{S, T, U, V\}$ sur l'alphabet $\Sigma =
\{{\#},{@},{(},{)}, x, y, z\}$ (soit $7$ lettres) donnée par
\[
\begin{aligned}
S &\rightarrow T \;|\; S\mathbin{\#}T\\
T &\rightarrow U \;|\; U\mathbin{@}T\\
U &\rightarrow V \;|\; (\,S\,)\\
V &\rightarrow x \;|\; y \;|\; z\\
\end{aligned}
\]
(On pourra imaginer que $\#$ et $@$ sont deux opérations binaires, les
parenthèses servent comme on s'y attend, et $x,y,z$ sont trois opérandes
auxquelles on peut vouloir appliquer ces opérations.)
La grammaire en question est inambiguë (on ne demande pas de le
démontrer).
(1) Donner les arbres d'analyse (=de dérivation) des mots suivants :
(a) $x\mathbin{\#}y\mathbin{\#}z$, (b) $x\mathbin{\#}y\mathbin{@}z$,
(c) $x\mathbin{@}y\mathbin{\#}z$, (d) $x\mathbin{@}y\mathbin{@}z$,
(e) $(x\mathbin{\#}y)\mathbin{@}z$.
\begin{corrige}
On obtient les arbres d'analyse suivants :
(a) % S<S<S<T<U<V<x.>>>>#.T<U<V<y.>>>>#.T<U<V<z.>>>>
\begin{tikzpicture}[line join=bevel,baseline=(S0.base)]
\node (S0) at (53.333bp,0.000bp) [draw=none] {$S$};
\node (S1) at (20.000bp,-30.000bp) [draw=none] {$S$}; \draw (S0) -- (S1);
\node (S2) at (0.000bp,-60.000bp) [draw=none] {$S$}; \draw (S1) -- (S2);
\node (T0) at (0.000bp,-80.000bp) [draw=none] {$T$}; \draw (S2) -- (T0);
\node (U0) at (0.000bp,-100.000bp) [draw=none] {$U$}; \draw (T0) -- (U0);
\node (V0) at (0.000bp,-120.000bp) [draw=none] {$V$}; \draw (U0) -- (V0);
\node (x0) at (0.000bp,-140.000bp) [draw=none] {$x$}; \draw (V0) -- (x0);
\node (o0) at (20.000bp,-60.000bp) [draw=none] {$\#$}; \draw (S1) -- (o0);
\node (T1) at (40.000bp,-60.000bp) [draw=none] {$T$}; \draw (S1) -- (T1);
\node (U1) at (40.000bp,-80.000bp) [draw=none] {$U$}; \draw (T1) -- (U1);
\node (V1) at (40.000bp,-100.000bp) [draw=none] {$V$}; \draw (U1) -- (V1);
\node (y0) at (40.000bp,-120.000bp) [draw=none] {$y$}; \draw (V1) -- (y0);
\node (o1) at (60.000bp,-30.000bp) [draw=none] {$\#$}; \draw (S0) -- (o1);
\node (T2) at (80.000bp,-30.000bp) [draw=none] {$T$}; \draw (S0) -- (T2);
\node (U2) at (80.000bp,-50.000bp) [draw=none] {$U$}; \draw (T2) -- (U2);
\node (V2) at (80.000bp,-70.000bp) [draw=none] {$V$}; \draw (U2) -- (V2);
\node (z0) at (80.000bp,-90.000bp) [draw=none] {$z$}; \draw (V2) -- (z0);
\end{tikzpicture}
\hskip1cmplus5cmminus.5cm
(b) % S<S<T<U<V<x.>>>>#.T<U<V<y.>>@.T<U<V<z.>>>>>
\begin{tikzpicture}[line join=bevel,baseline=(S0.base)]
\node (S0) at (26.667bp,0.000bp) [draw=none] {$S$};
\node (S1) at (0.000bp,-30.000bp) [draw=none] {$S$}; \draw (S0) -- (S1);
\node (T0) at (0.000bp,-50.000bp) [draw=none] {$T$}; \draw (S1) -- (T0);
\node (U0) at (0.000bp,-70.000bp) [draw=none] {$U$}; \draw (T0) -- (U0);
\node (V0) at (0.000bp,-90.000bp) [draw=none] {$V$}; \draw (U0) -- (V0);
\node (x0) at (0.000bp,-110.000bp) [draw=none] {$x$}; \draw (V0) -- (x0);
\node (o0) at (20.000bp,-30.000bp) [draw=none] {$\#$}; \draw (S0) -- (o0);
\node (T1) at (60.000bp,-30.000bp) [draw=none] {$T$}; \draw (S0) -- (T1);
\node (U1) at (40.000bp,-60.000bp) [draw=none] {$U$}; \draw (T1) -- (U1);
\node (V1) at (40.000bp,-80.000bp) [draw=none] {$V$}; \draw (U1) -- (V1);
\node (y0) at (40.000bp,-100.000bp) [draw=none] {$y$}; \draw (V1) -- (y0);
\node (o1) at (60.000bp,-60.000bp) [draw=none] {$@$}; \draw (T1) -- (o1);
\node (T2) at (80.000bp,-60.000bp) [draw=none] {$T$}; \draw (T1) -- (T2);
\node (U2) at (80.000bp,-80.000bp) [draw=none] {$U$}; \draw (T2) -- (U2);
\node (V2) at (80.000bp,-100.000bp) [draw=none] {$V$}; \draw (U2) -- (V2);
\node (z0) at (80.000bp,-120.000bp) [draw=none] {$z$}; \draw (V2) -- (z0);
\end{tikzpicture}
\hskip1cmplus5cmminus.5cm
(c) % S<S<T<U<V<x.>>@.T<U<V<y.>>>>>#.T<U<V<z.>>>>
\begin{tikzpicture}[line join=bevel,baseline=(S0.base)]
\node (S0) at (53.333bp,0.000bp) [draw=none] {$S$};
\node (S1) at (20.000bp,-30.000bp) [draw=none] {$S$}; \draw (S0) -- (S1);
\node (T0) at (20.000bp,-50.000bp) [draw=none] {$T$}; \draw (S1) -- (T0);
\node (U0) at (0.000bp,-80.000bp) [draw=none] {$U$}; \draw (T0) -- (U0);
\node (V0) at (0.000bp,-100.000bp) [draw=none] {$V$}; \draw (U0) -- (V0);
\node (x0) at (0.000bp,-120.000bp) [draw=none] {$x$}; \draw (V0) -- (x0);
\node (o0) at (20.000bp,-80.000bp) [draw=none] {$@$}; \draw (T0) -- (o0);
\node (T1) at (40.000bp,-80.000bp) [draw=none] {$T$}; \draw (T0) -- (T1);
\node (U1) at (40.000bp,-100.000bp) [draw=none] {$U$}; \draw (T1) -- (U1);
\node (V1) at (40.000bp,-120.000bp) [draw=none] {$V$}; \draw (U1) -- (V1);
\node (y0) at (40.000bp,-140.000bp) [draw=none] {$y$}; \draw (V1) -- (y0);
\node (o1) at (60.000bp,-30.000bp) [draw=none] {$\#$}; \draw (S0) -- (o1);
\node (T2) at (80.000bp,-30.000bp) [draw=none] {$T$}; \draw (S0) -- (T2);
\node (U2) at (80.000bp,-50.000bp) [draw=none] {$U$}; \draw (T2) -- (U2);
\node (V2) at (80.000bp,-70.000bp) [draw=none] {$V$}; \draw (U2) -- (V2);
\node (z0) at (80.000bp,-90.000bp) [draw=none] {$z$}; \draw (V2) -- (z0);
\end{tikzpicture}
\hskip1cmplus5cmminus.5cm
(d) % S<T<U<V<x.>>@.T<U<V<y.>>@.T<U<V<z.>>>>>>
\begin{tikzpicture}[line join=bevel,baseline=(S0.base)]
\node (S0) at (26.667bp,0.000bp) [draw=none] {$S$};
\node (T0) at (26.667bp,-20.000bp) [draw=none] {$T$}; \draw (S0) -- (T0);
\node (U0) at (0.000bp,-50.000bp) [draw=none] {$U$}; \draw (T0) -- (U0);
\node (V0) at (0.000bp,-70.000bp) [draw=none] {$V$}; \draw (U0) -- (V0);
\node (x0) at (0.000bp,-90.000bp) [draw=none] {$x$}; \draw (V0) -- (x0);
\node (o0) at (20.000bp,-50.000bp) [draw=none] {$@$}; \draw (T0) -- (o0);
\node (T1) at (60.000bp,-50.000bp) [draw=none] {$T$}; \draw (T0) -- (T1);
\node (U1) at (40.000bp,-80.000bp) [draw=none] {$U$}; \draw (T1) -- (U1);
\node (V1) at (40.000bp,-100.000bp) [draw=none] {$V$}; \draw (U1) -- (V1);
\node (y0) at (40.000bp,-120.000bp) [draw=none] {$y$}; \draw (V1) -- (y0);
\node (o1) at (60.000bp,-80.000bp) [draw=none] {$@$}; \draw (T1) -- (o1);
\node (T2) at (80.000bp,-80.000bp) [draw=none] {$T$}; \draw (T1) -- (T2);
\node (U2) at (80.000bp,-100.000bp) [draw=none] {$U$}; \draw (T2) -- (U2);
\node (V2) at (80.000bp,-120.000bp) [draw=none] {$V$}; \draw (U2) -- (V2);
\node (z0) at (80.000bp,-140.000bp) [draw=none] {$z$}; \draw (V2) -- (z0);
\end{tikzpicture}
\hskip1cmplus5cmminus.5cm
(e) % S<T<U<(.S<S<T<U<V<x.>>>>#.T<U<V<y.>>>>).>@.T<U<V<z.>>>>>
\begin{tikzpicture}[line join=bevel,baseline=(S0.base)]
\node (S0) at (86.667bp,0.000bp) [draw=none] {$S$};
\node (T0) at (86.667bp,-20.000bp) [draw=none] {$T$}; \draw (S0) -- (T0);
\node (U0) at (40.000bp,-50.000bp) [draw=none] {$U$}; \draw (T0) -- (U0);
\node (p0) at (0.000bp,-80.000bp) [draw=none] {$($}; \draw (U0) -- (p0);
\node (S1) at (40.000bp,-80.000bp) [draw=none] {$S$}; \draw (U0) -- (S1);
\node (S2) at (20.000bp,-110.000bp) [draw=none] {$S$}; \draw (S1) -- (S2);
\node (T1) at (20.000bp,-130.000bp) [draw=none] {$T$}; \draw (S2) -- (T1);
\node (U1) at (20.000bp,-150.000bp) [draw=none] {$U$}; \draw (T1) -- (U1);
\node (V0) at (20.000bp,-170.000bp) [draw=none] {$V$}; \draw (U1) -- (V0);
\node (x0) at (20.000bp,-190.000bp) [draw=none] {$x$}; \draw (V0) -- (x0);
\node (o0) at (40.000bp,-110.000bp) [draw=none] {$\#$}; \draw (S1) -- (o0);
\node (T2) at (60.000bp,-110.000bp) [draw=none] {$T$}; \draw (S1) -- (T2);
\node (U2) at (60.000bp,-130.000bp) [draw=none] {$U$}; \draw (T2) -- (U2);
\node (V1) at (60.000bp,-150.000bp) [draw=none] {$V$}; \draw (U2) -- (V1);
\node (y0) at (60.000bp,-170.000bp) [draw=none] {$y$}; \draw (V1) -- (y0);
\node (p1) at (80.000bp,-80.000bp) [draw=none] {$)$}; \draw (U0) -- (p1);
\node (o1) at (100.000bp,-50.000bp) [draw=none] {$@$}; \draw (T0) -- (o1);
\node (T3) at (120.000bp,-50.000bp) [draw=none] {$T$}; \draw (T0) -- (T3);
\node (U3) at (120.000bp,-70.000bp) [draw=none] {$U$}; \draw (T3) -- (U3);
\node (V2) at (120.000bp,-90.000bp) [draw=none] {$V$}; \draw (U3) -- (V2);
\node (z0) at (120.000bp,-110.000bp) [draw=none] {$z$}; \draw (V2) -- (z0);
\end{tikzpicture}
\end{corrige}
(2) En considérant que $(w)$ a le même effet ou la même valeur
que $w$ : (a) L'une des deux opérations $\#$ et $@$ est-elle
prioritaire\footnote{On dit qu'une opération binaire $\boxtimes$ est
\emph{prioritaire} sur $\boxplus$ lorsque « $u\boxtimes v\boxplus
w$ » se comprend comme « $(u\boxtimes v)\boxplus w$ » et
« $u\boxplus v\boxtimes w$ » comme « $u\boxplus (v\boxtimes w)$ ».}
sur l'autre ? Laquelle ?\quad (b) L'opération $\#$
s'associe-t-elle\footnote{On dit qu'une opération binaire $\boxdot$
\emph{s'associe à gauche} lorsque « $u\boxdot v\boxdot w$ » se
comprend comme « $(u\boxdot v)\boxdot w$ », et \emph{s'associe à
droite} lorsque « $u\boxdot v\boxdot w$ » se comprend comme
« $u\boxdot (v\boxdot w)$ ».} à gauche ou à droite ?\quad
(c) L'opération $@$ s'associe-t-elle à gauche ou à droite ?
\begin{corrige}
(a) Les arbres d'analyse (b) et (c) de la question (1) montrent que
l'opération $@$ est prioritaire sur $\#$ (elle est toujours plus
profonde dans l'arbre, c'est-à-dire appliquée en premier aux
opérandes).\quad (b) L'arbre d'analyse (a) de la question (1) montre
que $\#$ s'associe à gauche (le $\#$ entre les deux opérandes gauche
est plus profond, c'est-à-dire appliqué en premier).\quad
(c) Symétriquement, l'arbre d'analyse (d) de la question (1) montre
que $@$ s'associe à droite.
\end{corrige}
\begin{commentaire}
Beaucoup de copies affirment, par exemple, que l'opération $\#$ est
prioritaire sur $@$ parce que $\#$ est plus haut dans l'arbre ou se
rencontre en premier dans l'analyse : en réalité, l'opération
prioritaire est celle qui se calcule en premier, c'est-à-dire de la
façon la plus \emph{profonde} (on a précisé que $\boxtimes$ est
prioritaire sur $\boxplus$ lorsque « $u\boxtimes v\boxplus w$ » se
comprend comme « $(u\boxtimes v)\boxplus w$ » : c'est bien $\boxtimes$
qui est imbriqué le plus profondément dans les parenthèses, et la
comparaison avec l'arbre (e) aurait dû lever tout doute).
\end{commentaire}
\smallskip
(La question (3) est indépendante de (1) et (2). Par ailleurs, on
pourra, si on souhaite s'épargner des confusions, choisir d'appeler
$a$ la lettre « parenthèse ouvrante » de $\Sigma$ et $b$ la lettre
« parenthèse fermante » afin de les distinguer des parenthèses
mathématiques.)
(3) Soit $L = L(G)$ le langage engendré par $G$. Soit $M$ le langage
des mots sur $\Sigma$ formés d'un certain nombre de parenthèses
ouvrantes, puis de la lettre $x$, puis d'un certain nombre
(possiblement différent) de parenthèses fermantes : autrement dit, des
mots de la forme « ${(}^i\, x\, {)}^j$ », où on a noté « ${(}^i$ » une
succession de $i$ parenthèses ouvrantes et « ${)}^j$ » une succession
de $j$ parenthèses fermantes (on pourra noter ce mot $a^i x b^j$ si on
préfère).\quad (a) Décrire le langage $L\cap M$ (des mots de $L$ qui
appartiennent aussi à $M$).\quad (b) Ce langage $L\cap M$ est-il
rationnel ?\quad (c) Le langage $L$ est-il rationnel ?
\begin{corrige}
(a) Cherchons pour quelles valeurs $(i,j) \in \mathbb{N}^2$ le mot
« ${(}^i\, x\, {)}^j$ » de $M$ appartient à $L$. La dérivation $S
\rightarrow T \rightarrow U \rightarrow (S) \rightarrow (T)
\rightarrow (U) \rightarrow ((S)) \rightarrow \cdots
\rightarrow{(}^i\, S\, {)}^i \rightarrow{(}^i\, T\, {)}^i
\rightarrow{(}^i\, U\, {)}^i \rightarrow{(}^i\, V\, {)}^i
\rightarrow{(}^i\, x\, {)}^i$ montre que c'est le cas si $j=i$,
autrement dit s'il y a autant de parenthèses fermantes qu'ouvrantes.
Mais réciproquement, la propriété d'avoir autant de parenthèses
fermantes qu'ouvrantes est préservée par toutes les productions
de $G$ (et est satisfaite par l'axiome), donc est vérifiée par tout
mot de $L=L(G)$. On a donc prouvé que le $L\cap M$ est l'ensemble
des mots de la forme « ${(}^i\, x\, {)}^i$ » où $i\in \mathbb{N}$.
(b) Le langage $L\cap M$ constitué des mots de la forme « ${(}^n\,
x\, {)}^n$ » où $i\in \mathbb{N}$ n'est pas rationnel. Cela résulte
du lemme de pompage (presque exactement comme l'exemple du langage
$\{a^n b^n : i\in\mathbb{N}\}$ donné en cours) : donnons l'argument
en remplaçant la parenthèse ouvrante par $a$ et la parenthèse
fermante par $b$ pour plus de clarté notationnelle. Appliquons le
lemme de pompage pour les langages rationnels au langage $L \cap M =
\{a^n x b^n : i\in\mathbb{N}\}$ supposé par l'absurde être
rationnel : appelons $k$ l'entier dont le lemme de pompage garantit
l'existence. Considérons le mot $t := a^k x b^k$ : il doit alors
exister une factorisation $t = uvw$ pour laquelle on a (i) $|v|\geq
1$, (ii) $|uv|\leq k$ et (iii) $uv^iw \in L\cap M$ pour tout $i\geq
0$. La propriété (ii) assure que $uv$ est formé d'un certain nombre
de répétitions de la lettre $a$ (car tout préfixe de longueur $\leq
k$ de $a^k x b^k$ est de cette forme) ; disons $u = a^\ell$ et $v =
a^m$, si bien que $w = a^{k-\ell-m} x b^k$. La propriété (i)
donne $m\geq 1$. Enfin, la propriété (iii) affirme que le mot
$uv^iw = a^{k+(i-1)m} x b^k$ appartient à $L\cap M$ ; mais dès que
$i\neq 1$, ceci est faux : il suffit donc de prendre $i=0$ pour
avoir une contradiction.
(c) Le langage $M$ est rationnel puisqu'il est dénoté par l'expression
rationnelle $a{*}xb{*}$ (toujours en notant $a$ la parenthèse
ouvrante et $b$ la parenthèse fermante). Si le langage $L$ était
rationnel, le langage $L\cap M$ le serait aussi (on sait que
l'intersection de deux langages rationnels est rationnelle), ce qui
n'est pas le cas d'après la question (b). Le langage $L$ n'est donc
pas rationnel.
\end{corrige}
\begin{commentaire}
Dans la question (a), beaucoup de copies montrent correctement une
seule implication (que tout mot de la forme « ${(}^i\, x\, {)}^j$ »
appartient à $L\cap M$, ou bien que tout mot de $L\cap M$ a cette
forme), mais oublient qu'il est essentiel de traiter les deux.
Pour ce qui est de la question (b), certains se sont rendu la vie
inutilement compliquée en prenant certes un mot de la forme $a^i x
b^i$ mais en ne choisissant pas $i=k$ (ou au moins $i\geq k$), ce qui
oblige à des discussions de cas qui n'avaient pas lieu d'être. On
rappelle donc que lorsqu'on applique le lemme de pompage, on choisit
le mot $t$ auquel on va appliquer la propriété (la seule contrainte
étant de devoir prendre $|t|\geq k$).
La question (c) a été étonnamment peu traitée eu égard à sa
simplicité. Beaucoup ne montrent pas, ne pensent pas à montrer, ou ne
savent pas montrer, que $M$ est rationnel (ce qui devrait pourtant
sauter aux yeux...). Certains arrivent à des conclusions fantaisistes
comme « $L$ est rationnel ».
\end{commentaire}
%
%
%
\exercice
(On pourra si on le souhaite remplacer $\mathbb{N}$ partout dans cet
exercice par l'ensemble $\Sigma^*$ des mots sur un alphabet $\Sigma$
[fini] non vide fixé quelconque.)
Dans cet exercice, on appelle « langage » une partie de $\mathbb{N}$
(cf. le paragraphe précédent). On dira que deux langages $L,M$
disjoints (c'est-à-dire $L\cap M = \varnothing$) sont
\emph{calculablement séparables} lorsqu'il existe un langage $E$
décidable tel que $L \subseteq E$ et $M \subseteq (\mathbb{N}\setminus
E)$ (où $\mathbb{N}\setminus E$ désigne le complémentaire de $E$) ;
dans le cas contraire, on les dit \emph{calculablement inséparables}.
(1) Expliquer pourquoi deux langages $L,M$ disjoints sont
calculablement séparables si et seulement s'il existe un algorithme
qui, prenant en entrée un élément $x$ de $\mathbb{N}$ :
\begin{itemize}
\item termine toujours en temps fini,
\item répond « vrai » si $x\in L$ et « faux » si $x \in M$ (rien n'est
imposé si $x\not\in L\cup M$).
\end{itemize}
\begin{corrige}
Si $E$ est décidable tel que $L \subseteq E$ et $M \subseteq
(\mathbb{N}\setminus E)$, alors un algorithme qui décide $E$
(c'est-à-dire, quand on lui fournit l'entrée $x$, répond « vrai » si
$x\in E$, et « faux » si $x \not\in E$) répond bien aux critères
demandés. Réciproquement, donné un algorithme qui répond aux critères
demandés, si $E$ est l'ensemble des $x$ sur lesquels il répond
« vrai », alors $E$ est bien décidable (on peut toujours modifier
l'algorithme si nécessaire pour qu'il ne réponde que « vrai » ou
« faux »), et on a $L \subseteq E$ et $M \subseteq
(\mathbb{N}\setminus E)$.
\end{corrige}
(2) Expliquer pourquoi deux langages \emph{décidables} disjoints sont
toujours calculablement séparables.
\begin{corrige}
Si $L,M$ sont décidables disjoints, on peut poser $E = L$, qui est
décidable et vérifie à la fois $L \subseteq E$ (trivialement) et $M
\subseteq (\mathbb{N}\setminus E)$ (c'est une reformulation du fait
que $M$ est disjoint de $E=L$).
\end{corrige}
On cherche maintenant à montrer qu'il existe deux langages $L,M$
\emph{semi-décidables} disjoints et calculablement inséparables.
Pour cela, on appelle $L$ l'ensemble des couples\footnote{Pour être
rigoureux, on a fixé un codage permettant de représenter les
programmes $e$, les entrées $x$ à ces programmes, et les couples
$(e,x)$ comme des éléments de $\mathbb{N}$. Il n'est pas nécessaire
de faire apparaître ce codage dans la description des algorithmes
proposés, qui peut rester informelle.} $(e,x)$ formés d'un programme
(=algorithme) $e$ et d'une entrée $x$, tels que l'exécution du
programme $e$ sur l'entrée $x$ termine en temps fini et renvoie la
valeur $1$ (ce qui peut se noter $\varphi_e(x) = 1$) ; et $M$ le
langage défini de la même manière mais avec la valeur $2$,
i.e., $\varphi_e(x) = 2$. (Ici, $1$ et $2$ peuvent être remplacés par
deux éléments distincts quelconques de $\mathbb{N}$ : si on a souhaité
remplacer $\mathbb{N}$ par $\Sigma^*$, on peut prendre deux mots
distincts quelconques, par exemple $a$ et $aa$.)
(3) Pourquoi $L$ et $M$ sont-ils disjoints ?
\begin{corrige}
Comme $L$ est l'ensemble des couples $(e,x)$ tels que $\varphi_e(x) =
1$ et $M$ l'ensemble des couples $(e,x)$ tels que $\varphi_e(x) = 2$,
aucun couple ne peut appartenir aux deux, c'est-à-dire qu'ils sont
disjoints.
\end{corrige}
(4) Pourquoi $L$ et $M$ sont-ils semi-décidables ?
\begin{corrige}
Pour semi-décider si un couple $(e,x)$ appartient à $L$, il suffit de
lancer l'exécution du programme $e$ sur l'entrée $x$ et, si elle
termine en retournant $1$, renvoyer « vrai », tandis que si elle
termine en renvoyant n'importe quelle autre valeur, faire une boucle
infinie (bien sûr, si le programme $e$ ne termine jamais sur
l'entrée $x$, on ne termine pas non plus). Ceci montre que $L$ est
semi-décidable. Le même raisonnement s'applique pour $M$.
\end{corrige}
\begin{commentaire}
Certains pensent pouvoir déduire la semi-décidabilité de $L$ et $M$ de
celle du problème de l'arrêt : la situation est effectivement proche,
mais à moins d'une explication précise sur le fait qu'on peut calculer
la valeur $\varphi_e(x)$ une fois qu'on s'est assuré qu'elle est bien
définie, ce n'est pas légitime ; d'ailleurs, la semi-décidabilité du
problème de l'arrêt est quelque chose de tellement simple (une fois
acquise l'existence d'une machine universelle) qu'on ne devrait jamais
l'invoquer, car il sera essentiellement toujours plus simple de dire
« il suffit de lancer l'exécution du programme... ».
\end{commentaire}
(5) En imitant la démonstration du théorème de Turing sur
l'indécidabilité du problème de l'arrêt, montrer qu'il n'existe aucun
algorithme qui, prenant en entrée un couple $(e,x)$, termine toujours
en temps fini et répond « vrai » si $(e,x)\in L$ et « faux » si $(e,x)
\in M$ (indication : si un tel algorithme existait, on pourrait s'en
servir pour faire le contraire de ce qu'il prédit).
\begin{corrige}
Montrons par l'absurde qu'il n'existe aucun algorithme $T$ comme
annoncé. Définissons un nouvel algorithme $T'$ qui, donné un
entier $e$, effectue les calculs suivants : (1º) interroger
l'algorithme $T$ (supposé exister !) en lui fournissant le couple
$(e,e)$ comme entrée, et ensuite (2º) s'il répond vrai, renvoyer la
valeur $2$, tandis que s'il répond n'importe quoi d'autre, renvoyer la
valeur $1$. L'algorithme $T'$ qui vient d'être décrit aurait un
certain numéro, disons, $p$, et la description de l'algorithme fait
qu'il termine toujours, que la valeur $\varphi_p(e)$ qu'il renvoie
vaut toujours soit $1$ soit $2$, et qu'elle vaut $2$ si $(e,e) \in L$
(c'est-à-dire si $\varphi_e(e) = 1$) et $1$ si $(e,e) \in M$
(c'est-à-dire si $\varphi_e(e) = 2$). En particulier, en prenant
$e=p$, on voit que $\varphi_p(p)$ doit valoir $1$ ou $2$, doit valoir
$2$ si $\varphi_p(p) = 1$ et $1$ si $\varphi_p(p) = 2$, ce qui est une
contradiction.
\end{corrige}
\begin{commentaire}
Il n'y a eu à peu près qu'une réponse correcte à cette question.
Quelques points partiels ont été attribués à ceux qui tentaient au
moins de dire quelque chose et qui avaient un semblant d'idée.
\end{commentaire}
(6) Conclure.
\begin{corrige}
La question (5) montre (compte tenu de la question (1)) que $L$ et $M$
ne sont pas calculablement séparables, i.e.., sont calculablement
inséparables, tandis que (4) et (5) montrent que $L$ et $M$ sont
disjoints et semi-décidables. On a donc bien montré l'existence de
langages semi-décidables disjoints et calculablement inséparables.
\end{corrige}
\begin{commentaire}
Bien qu'elle fût essentiellement triviale (il suffisait de redire les
résultats des questions précédentes), cette question n'a quasiment pas
été traitée.
\end{commentaire}
\smallskip
{\footnotesize (Remarque culturelle :\quad La construction de langages
semi-décidables disjoints mais calculablement inséparables a des
applications en logique : de même que le théorème de Turing sur le
problème de l'arrêt était, historiquement destiné à donner une
démonstration différente du théorème de Gödel sur l'existence
d'énoncés mathématiques indécidables, de même, l'énoncé qu'on vient
de prouver peut servir par des techniques analogues à montrer qu'il
existe des énoncés « indécidablement indécidables », c'est-à-dire
que leur indécidabilité est elle-même indécidable.)\par}
%
%
%
\end{document}
|