%% This is a LaTeX document. Hey, Emacs, -*- latex -*- , get it? \documentclass[12pt,a4paper]{article} \usepackage[francais]{babel} \usepackage[utf8]{inputenc} \usepackage[T1]{fontenc} %\usepackage{ucs} \usepackage{times} % A tribute to the worthy AMS: \usepackage{amsmath} \usepackage{amsfonts} \usepackage{amssymb} \usepackage{amsthm} % \usepackage{mathrsfs} \usepackage{wasysym} \usepackage{url} % \usepackage{graphics} \usepackage[usenames,dvipsnames]{xcolor} \usepackage{tikz} \usetikzlibrary{arrows,automata,positioning} \usepackage[hyperindex=false]{hyperref} % \theoremstyle{definition} \newtheorem{comcnt}{Tout}[subsection] \newcommand\thingy{% \refstepcounter{comcnt}\smallbreak\noindent\textbf{\thecomcnt.} } \newtheorem{defn}[comcnt]{Définition} \newtheorem{prop}[comcnt]{Proposition} \newtheorem{lem}[comcnt]{Lemme} \newtheorem{thm}[comcnt]{Théorème} \newtheorem{cor}[comcnt]{Corollaire} \newtheorem{scho}[comcnt]{Scholie} \newtheorem{algo}[comcnt]{Algorithme} \renewcommand{\qedsymbol}{\smiley} % \newcommand{\liff}{\mathrel{\Longleftrightarrow}\relax} % \DeclareUnicodeCharacter{00A0}{~} \DeclareUnicodeCharacter{03B5}{$\varepsilon$} % \DeclareMathSymbol{\tiret}{\mathord}{operators}{"7C} \DeclareMathSymbol{\traitdunion}{\mathord}{operators}{"2D} % % \DeclareFontFamily{U}{manual}{} \DeclareFontShape{U}{manual}{m}{n}{ <-> manfnt }{} \newcommand{\manfntsymbol}[1]{% {\fontencoding{U}\fontfamily{manual}\selectfont\symbol{#1}}} \newcommand{\dbend}{\manfntsymbol{127}}% Z-shaped \newcommand{\danger}{\noindent\hangindent\parindent\hangafter=-2% \hbox to0pt{\hskip-\hangindent\dbend\hfill}} % % % NOTE: compile dot files with % dot2tex --figonly -f tikz --tikzedgelabels --graphstyle=automaton file.dot > file.tex \tikzstyle{automaton}=[>=stealth',initial text={},thick,every loop/.style={min distance=7mm,looseness=5}] \tikzstyle{state}=[] \tikzstyle{final}=[accepting by arrow] % % % \begin{document} \title{THL (Théorie des langages)\\Notes de cours \textcolor{red}{provisoires}} \author{David A. Madore} \maketitle \centerline{\textbf{INF105}} {\footnotesize \immediate\write18{sh ./vc > vcline.tex} \begin{center} Git: \input{vcline.tex} \end{center} \immediate\write18{echo ' (stale)' >> vcline.tex} \par} \pretolerance=8000 \tolerance=50000 % % % {\footnotesize \tableofcontents \par} \bigbreak \section{Alphabets, mots et langages} \subsection{Introduction, alphabets, mots et longueur} \thingy L'objet de ces notes, au confluent des mathématiques et de l'informatique, est l'étude des \textbf{langages} : un langage étant un ensemble de \textbf{mots}, eux-mêmes suites finies de \textbf{lettres} choisies dans un \textbf{alphabet}, on va commencer par définir ces différents termes avant de décrire plus précisément l'objet de l'étude. \thingy Le point de départ est donc ce que les mathématiciens appelleront un \textbf{alphabet}, et qui correspond pour les informaticiens à un \textbf{jeu de caractères}. Il s'agit d'un ensemble \emph{fini}, sans structure particulière, dont les éléments s'appellent \textbf{lettres}, ou encore \textbf{caractères} dans une terminologie plus informatique. Les exemples mathématiques seront souvent donnés sur un alphabet tel que l'alphabet à deux lettres $\{a,b\}$ ou à trois lettres $\{a,b,c\}$. On pourra aussi considérer l'alphabet $\{0,1\}$ appelé \textbf{binaire} (puisque l'alphabet n'a pas de structure particulière, cela ne fait guère de différence par rapport à n'importe quel autre alphabet à deux lettres). Dans un contexte informatique, des jeux de caractères (=alphabets) souvent importants sont ASCII, Latin-1 ou Unicode : en plus de former un ensemble, ces jeux de caractère attribuent un numéro à chacun de leurs éléments (par exemple, la lettre A majuscule porte le numéro 65 dans ces trois jeux de caractères), mais cette structure supplémentaire ne nous intéressera pas ici. Dans tous les cas, il est important pour la théorie que l'alphabet soit \emph{fini}. L'alphabet sera généralement fixé une fois pour toutes dans la discussion, et désigné par la lettre $\Sigma$ (sigma majuscule). \thingy Un \textbf{mot} sur l'alphabet $\Sigma$ est une suite finie de lettres (éléments de $\Sigma$) ; dans la terminologie informatique, on parle plutôt de \textbf{chaîne de caractères}, qui est une suite finie (=liste) de caractères. Le mot est désigné en écrivant les lettres les unes à la suite des autres : autrement dit, si $x_1,\ldots,x_n \in \Sigma$ sont des lettres, le mot formé par la suite finie $x_1,\ldots,x_n$ est simplement écrit $x_1\cdots x_n$. À titre d'exemple, $abbcab$ est un mot sur l'alphabet $\Sigma = \{a,b,c,d\}$, et \texttt{foobar} est un mot (=chaîne de caractères) sur l'alphabet ASCII. (Dans un contexte informatique, il est fréquent d'utiliser une sorte de guillemet pour délimiter les chaînes de caractères : on écrira donc \texttt{\char`\"foobar\char`\"} pour parler du mot en question. Dans ces notes, nous utiliserons peu cette convention.) L'ensemble des mots sur un alphabet $\Sigma$ est généralement désigné $\Sigma^*$ (on verra que l'étoile fait partie d'un usage plus général qui sera défini ci-dessous). Par exemple, si $\Sigma = \{0,1\}$, alors $\Sigma^*$ est l'ensemble (infini !) dont les éléments sont toutes les suites finies binaires (=suites finies de $0$ et de $1$). \thingy Le nombre $n$ de lettres dans un mot $w \in \Sigma^*$ est appelé la \textbf{longueur} du mot, et généralement notée $|w|$ ou bien $\ell(w)$ : autrement dit, si $x_1,\ldots,x_n \in \Sigma$, alors la longueur $\ell(x_1\cdots x_n)$ du mot $x_1\cdots x_n$, vaut $n$. Ceci coïncide bien avec la notion usuelle de longueur d'une chaîne de caractères en informatique. À titre d'exemple, sur l'alphabet $\Sigma=\{a,b,c,d\}$, la longueur du mot $abbcab$ vaut $6$ (on écrira $|abbcab|=6$ ou bien $\ell(abbcab)=6$). \thingy Quel que soit l'alphabet, il existe un unique mot de longueur $0$, c'est-à-dire un unique mot n'ayant aucune lettre, appelé le \textbf{mot vide} (ou la \textbf{chaîne [de caractères] vide}). Étant donné qu'il n'est pas commode de désigner un objet par une absence de symbole, on introduit un symbole spécial, généralement $\varepsilon$, pour désigner ce mot vide : on a donc $|\varepsilon|=0$. On souligne que le symbole $\varepsilon$ \underline{ne fait pas partie} de l'alphabet $\Sigma$, c'est un symbole \emph{spécial} qui a été introduit pour désigner le mot vide. (Lorsque les mots sont délimités par des guillemets, comme il est usage pour les chaînes de caractères en informatique, le mot vide n'a pas besoin d'un symbole spécial : il s'écrit juste \texttt{\char`\"\char`\"} — sans aucun caractère entre les guillemets.) {\footnotesize Lorsque l'alphabet $\Sigma$ est \emph{vide}, c'est-à-dire $\Sigma=\varnothing$, alors le mot vide est le seul mot qui existe : on a $\Sigma^*=\{\varepsilon\}$ dans ce cas. C'est la seule situation où l'ensemble $\Sigma^*$ des mots est un ensemble fini. Dans la suite, nous négligerons parfois ce cas particulier, qu'on pourra oublier : c'est-à-dire que nous ferons parfois l'hypothèse tacite que $\Sigma \neq \varnothing$.\par} La notation $\Sigma^+$ est parfois utilisée pour désigner l'ensemble des mots \emph{non vides} sur l'alphabet $\Sigma$ (par opposition à $\Sigma^*$ qui désigne l'ensemble de tous les mots, y compris le mot vide). \thingy\label{convention-on-words-of-length-one} Les mots d'une seule lettre sont naturellement en correspondance avec les lettres elles-mêmes : on identifiera souvent tacitement, quoique un peu abusivement, une lettre $x\in\Sigma$ et le mot de longueur $1$ formé de la seule lettre $x$. (En informatique, cette identification entre \emph{caractères} et \emph{chaînes de caractères de longueur $1$} est faite par certains langages de programmation, mais pas par tous : \textit{caveat programmator}.) Ceci permet d'écrire par exemple $\Sigma \subseteq \Sigma^*$ ou bien $|x|=1 \liff x\in\Sigma$. \thingy\label{number-of-words-of-length-n} Si le cardinal de l'alphabet $\Sigma$ vaut $\#\Sigma = N$, alors, pour chaque $n$, le nombre de mots de longueur exactement $n$ est égal à $N^n$ (combinatoire classique). Le nombre de mots de longueur $\leq n$ vaut donc $1 + N + \cdots + N^n = \frac{N^{n+1}-1}{N-1}$ (somme d'une série géométrique). \subsection{Concaténation de mots, préfixes, suffixes, facteurs, sous-mots} \thingy Si $u := x_1\cdots x_m$ et $v := y_1\cdots y_n$ sont deux mots, de longueurs respectives $m$ et $n$, sur un même alphabet $\Sigma$, alors on définit un mot $uv := x_1\cdots x_m y_1\cdots y_n$ de longueur $m+n$, dont les lettres sont obtenues en mettant bout à bout celles de $u$ puis celles de $v$ (dans cet ordre), et on l'appelle \textbf{concaténation} (ou, si cela ne prête pas à confusion, simplement \textbf{produit}) des mots $u$ et $v$. (Dans un contexte informatique, on parle de concaténation de chaînes de caractères.) \thingy Parmi les propriétés de la concaténation, signalons les faits suivants : \begin{itemize} \item le mot vide $\varepsilon$ est « \textbf{neutre} » pour la concaténation, ce qui signifie par définition : $\varepsilon w = w \varepsilon = w$ quel que soit le mot $w \in \Sigma^*$ ; \item la concaténation est « \textbf{associative} », ce qui signifie par définition : $u(vw) = (uv)w$ quels que soient les mots $u,v,w \in \Sigma^*$. \end{itemize} On peut traduire de façon savante ces deux propriétés en une phrase : l'ensemble $\Sigma^*$ est un \textbf{monoïde}, d'élément neutre $\varepsilon$, pour la concaténation (cela signifie exactement ce qui vient d'être dit). \thingy On a par ailleurs $|uv| = |u| + |v|$ (la longueur de la concaténation de deux mots est la somme des concaténations), et on rappelle par ailleurs que $|\varepsilon| = 0$ ; on peut traduire cela de manière savante : la longueur est un \textbf{morphisme de monoïdes} entre le monoïde $\Sigma^*$ des mots (pour la concaténation) et le monoïde $\mathbb{N}$ des entiers naturels (pour l'addition) (cela signifie exactement ce qui vient d'être dit). {\footnotesize\thingy \textbf{Complément :} Le monoïde $\Sigma^*$ possède la propriété suivante par rapport à l'ensemble $\Sigma$ : si $M$ est un monoïde quelconque (c'est-à-dire un ensemble muni d'une opération binaire associative $\cdot$ et d'un élément $e$ neutre pour cette opération), et si $\psi\colon \Sigma\to M$ est une application quelconque, alors il existe un unique morphisme de monoïdes $\hat\psi\colon \Sigma^* \to M$ (c'est-à-dire une application préservant le neutre et l'opération binaire) tel que $\hat\psi(x) = \psi(x)$ si $x\in\Sigma$. (Démonstration : on a nécessairement $\hat\psi(x_1\cdots x_n) = \psi(x_1)\cdots \psi(x_n)$, or ceci définit bien un morphisme comme annoncé.) On dit qu'il s'agit là d'une propriété « universelle », et plus précisément que $\Sigma^*$ est le \textbf{monoïde libre} sur l'ensemble $\Sigma$. Par exemple, le morphisme « longueur » $\ell\colon\Sigma^*\to\mathbb{N}$ est le $\ell = \hat\psi$ obtenu en appliquant cette propriété à la fonction $\psi(x) = 1$ pour tout $x\in\Sigma$.\par} \thingy\label{powers-of-a-word} Lorsque $w \in \Sigma^*$ et $r \in \mathbb{N}$, on définit un mot $w^r$ comme la concaténation de $r$ facteurs tous égaux au mot $w$, autrement dit, comme la répétition $r$ fois du mot $w$. Formellement, on définit par récurrence : \begin{itemize} \item $w^0 = \varepsilon$ (le mot vide), \item $w^{r+1} = w^r w$. \end{itemize} (Ces définitions valent, d'ailleurs, dans n'importe quel monoïde. On peut constater que $w^r w^s = w^{r+s}$ quels que soient $r,s\in\mathbb{N}$.) On a bien sûr $|w^r| = r|w|$. Cette définition sert notamment à désigner de façon concise les mots comportant des répétitions d'une même lettre : par exemple, le mot $aaaaa$ peut s'écrire tout simplement $a^5$, et le mot $aaabb$ peut s'écrire $a^3 b^2$. (De même que pour le mot vide, il faut souligner que ces exposants ne font pas partie de l'alphabet.) \thingy Lorsque $u,v,w \in \Sigma^*$ vérifient $w = uv$, autrement dit lorsque le mot $w$ est la concaténation des deux mots $u$ et $v$, on dira également : \begin{itemize} \item que $u$ est un \textbf{préfixe} de $w$, ou \item que $v$ est un \textbf{suffixe} de $w$. \end{itemize} De façon équivalente, si $w = x_1\cdots x_n$ (où $x_1,\ldots,x_n \in \Sigma$) est un mot de longueur $n$, et si $0\leq k\leq n$ est un entier quelconque compris entre $0$ et $n$, on dira que $u := x_1\cdots x_k$ (c'est-à-dire, le mot formé des $k$ premières lettres de $w$, dans le même ordre) est le \textbf{préfixe de longueur $k$} de $w$, et que $v := x_{k+1}\cdots x_n$ (mot formé des $n-k$ dernières lettres de $w$, dans le même ordre) est le \textbf{suffixe de longueur $n-k$} de $w$. Il est clair qu'il s'agit bien là de l'unique façon d'écrire $w = uv$ avec $|u|=k$ et $|v|=n-k$, ce qui fait le lien avec la définition donnée au paragraphe précédent ; parfois on dira que $v$ est le suffixe \textbf{correspondant} à $u$ ou que $u$ est le préfixe correspondant à $v$ (dans le mot $w$). Le mot vide est préfixe et suffixe de n'importe quel mot. Le mot $w$ lui-même est aussi un préfixe et un suffixe de lui-même. Entre les deux, pour n'importe quelle longueur $k$ donnée, il existe un unique préfixe et un unique suffixe de longueur $k$. (Il peut tout à fait se produire que le préfixe et le suffixe de longueur $k$ soient égaux pour d'autres $k$ que $0$ et $|w|$, comme le montre l'exemple qui suit.) À titre d'exemple, le mot $abbcab$ sur l'alphabet $\Sigma=\{a,b,c,d\}$ a les sept préfixes suivants, rangés par ordre croissant de longueur : $\varepsilon$ (le mot vide), $a$, $ab$, $abb$, $abbc$, $abbca$ et $abbcab$ lui-même ; il a les sept suffixes suivants, rangés par ordre croissant de longueur : $\varepsilon$ (le mot vide), $b$, $ab$, $cab$, $bcab$, $bbcab$ et $abbcab$ lui-même. Le suffixe correspondant au préfixe $abb$ est $bcab$ puisque $abbcab = (abb)(bcab)$. \thingy Comme généralisation à la fois de la notion de préfixe et de celle de suffixe, on a la notion de facteur : si $u_0,v,u_1 \in \Sigma^*$ sont trois mots quelconques sur un même alphabet $\Sigma$, et si $w = u_0 v u_1$ est leur concaténation, on dira que $v$ est un \textbf{facteur} de $w$. Alors qu'un préfixe ou suffixe du mot $w$ est déterminé simplement par sa longueur, un facteur est déterminé par sa longueur et l'emplacement à partir duquel il commence. À titre d'exemple, les facteurs du mot $abbcab$ sont : $\varepsilon$ (le mot vide), $a$, $b$, $c$, $ab$, $bb$, $bc$, $ca$, $abb$, $bbc$, $bca$, $cab$, $abbc$, $bbca$, $bcab$, $abbca$, $bbcab$ et $abbcab$ lui-même. Dans un contexte informatique, ce que nous appelons ici « facteur » est souvent appelé « sous-chaîne [de caractères] ». Il ne faut cependant pas confondre ce concept avec celui de sous-mot défini ci-dessous. \thingy\label{definition-subword} Si $u_0,\ldots,u_r$ et $v_1,\ldots,v_r$ sont des mots sur un même alphabet $\Sigma$, on dira que $v := v_1\cdots v_r$ est un \textbf{sous-mot} du mot $w := u_0 v_1 u_1 v_2 \cdots u_{r-1} v_r u_r$. En plus clair, cela signifie que $v$ est obtenu en ne gardant que certaines lettres du mot $w$ (celles des $v_i$), dans le même ordre, mais en en effaçant d'autres (celles des $u_i$) ; à la différence du concept de facteur, celui de sous-mot n'exige pas que les lettres gardées soient consécutives. À titre d'exemple, le mot $acb$ est un sous-mot du mot $abbcab$ (obtenu en gardant les lettres soulignées ici : $\underline{a}bb\underline{c}a\underline{b}$ ; pour se rattacher à la définition ci-dessus, on pourra prendre $u_0 = \varepsilon$ et $v_1 = a$ et $u_1 = bb$ et $v_2 = c$ et $u_2 = a$ et $v_3 = b$ et $u_3 = \varepsilon$). \thingy Si $w = x_1\cdots x_n$, où $x_1,\ldots,x_n \in \Sigma$, est un mot de longueur $n$ sur un alphabet $\Sigma$, alors on définit son mot \textbf{miroir} ou \textbf{transposé}, parfois noté $w^{\textsf{R}}$ ou $w^{\textsf{T}}$ (parfois les exposants sont écrits à gauche), comme le mot $x_n\cdots x_1$ dont les lettres sont les mêmes que celles de $w$ mais dans l'ordre inverse. À titre d'exemple, $(ababb)^{\textsf{R}} = bbaba$. On remarquera que $(w_1 w_2)^{\textsf{R}} = w_2^{\textsf{R}} w_1^{\textsf{R}}$ si $w_1,w_2$ sont deux mots quelconques. Un mot $w$ est dit \textbf{palindrome} lorsque $w = w^{\textsf{R}}$. \subsection{Langages et opérations sur les langages} \thingy Un \textbf{langage} $L$ sur l'alphabet $\Sigma$ est simplement un ensemble de mots sur $\Sigma$. Autrement dit, il s'agit d'un sous-ensemble (=une partie) de l'ensemble $\Sigma^*$ de tous les mots sur $\Sigma^*$ : en symboles, $L \subseteq \Sigma^*$. On souligne qu'on ne demande pas que $L$ soit fini (mais il peut l'être). \thingy À titre d'exemple, l'ensemble $\{d,dc,dcc,dccc,dcccc,\ldots\} = \{dc^r \colon r\in\mathbb{N}\}$ des mots formés d'un $d$ suivi d'un nombre quelconque (éventuellement nul) de $c$ est un langage sur l'alphabet $\Sigma = \{a,b,c,d\}$. On verra plus loin que ce langage est « rationnel » (et pourra être désigné par l'expression rationnelle $dc{*}$). Voici quelques autres exemples de langages : \begin{itemize} \item Le langage (fini) $\{foo,bar,baz\}$ formé des seuls trois mots $foo$, $bar$, $baz$ sur l'alphabet $\Sigma = \{a,b,f,o,r,z\}$. \item Le langage (fini) formé des mots de longueur exactement $42$ sur l'alphabet $\Sigma = \{p,q,r\}$. Comme on l'a vu en \ref{number-of-words-of-length-n}, cet ensemble a pour cardinal exactement $3^{42}$. \item Le langage (fini) formé du seul mot vide (=mot de longueur exactement $0$) sur l'alphabet, disons, $\Sigma = \{p,q,r\}$. Ce langage $\{\varepsilon\}$ a pour cardinal $1$ (ou $3^0$ si on veut). Il ne faut pas le confondre avec le suivant : \item Le langage vide, qui ne contient aucun mot (sur un alphabet quelconque). Ce langage a pour cardinal $0$. \item Le langage formé des mots de une seule lettre sur un alphabet $\Sigma$, qu'on peut identifier à $\Sigma$ lui-même (en identifiant un mot de une lettre à la lettre en question). \item Le langage sur l'alphabet $\Sigma=\{a,b\}$ formé des mots qui commencent par trois $a$ consécutifs : ou, si on préfère, qui ont le mot $aaa$ comme préfixe. \item Le langage sur l'alphabet $\Sigma=\{a,b\}$ formé des mots qui contiennent trois $a$ consécutifs ; ou, si on préfère, qui ont $aaa$ comme facteur. \item Le langage sur l'alphabet $\Sigma=\{a,b\}$ formé des mots qui contiennent au moins trois $a$, non nécessairement consécutifs ; ou, si on préfère, qui ont $aaa$ comme sous-mot. \item Le langage sur l'alphabet $\Sigma=\{a\}$ formé de tous les mots dont la longueur est un nombre premier ($L = \{aa, aaa, a^5, a^7, a^{11},\ldots\}$). Ce langage est infini. \item Le langage sur l'alphabet $\Sigma=\{0,1\}$ formé de tous les mots commençant par un $1$ et qui, interprétés comme un nombre écrit en binaire, désignent un nombre premier ($L = \{10, 11, 101, 111, 1011, \ldots\}$). \item Le langage sur l'alphabet Unicode formé de tous les mots qui constituent un document XML bien-formé d'après la spécification XML 1.0. \end{itemize} \thingy On pourrait aussi considérer un langage (sur l'alphabet $\Sigma$) comme une \emph{propriété} des mots (sur l'alphabet en question). Précisément, si $P$ est une propriété qu'un mot $w \in \Sigma^*$ peut ou ne pas avoir, on considère le langage $L_P = \{w \in \Sigma^* : w \text{~a la propriété~} P\}$, et inversement, si $L \subseteq \Sigma^*$ est un langage, on considère la propriété « appartenir à $L$ » : en identifiant la propriété et le langage qu'on vient d'associer l'un à l'autre (par exemple, le langage des mots commençant par $a$ et la propriété « commencer par $a$ »), un langage pourrait être considéré comme une propriété des mots. {\footnotesize(Ceci n'a rien de spécifique aux langages : une partie d'un ensemble $E$ quelconque peut être identifiée à une propriété que les éléments de $E$ peuvent ou ne pas avoir, à savoir, appartenir à la partie en question.)\par} On évitera de faire cette identification pour ne pas introduire de confusion, mais il est utile de la garder à l'esprit : par exemple, dans un langage de programmation fonctionnel, un « langage » au sens de ces notes peut être considéré comme une fonction (pure, c'est-à-dire, déterministe et sans effet de bord) prenant en entrée une chaîne de caractères et renvoyant un booléen. \thingy Si $L_1$ et $L_2$ sont deux langages sur un même alphabet $\Sigma$ (autrement dit, $L_1,L_2 \subseteq \Sigma^*$), on peut former les langages \textbf{union} $L_1\cup L_2$ et \textbf{intersection} $L_1\cap L_2$ qui sont simplement les opérations ensemblistes usuelles (entre parties de $\Sigma^*$). Les opérations correspondantes sur les propriétés de mots sont respectivement le « ou logique » (=disjonction) et le « et logique » (=conjonction) : à titre d'exemple, sur $\Sigma = \{a,b\}$ si $L_1$ est le langage des mots commençant par $a$ et $L_2$ le langage des mots finissant par $b$, alors $L_1 \cup L_2$ est le langage des mots commençant par $a$ \emph{ou bien} finissant par $b$, tandis que $L_1 \cap L_2$ est le langage des mots commençant par $a$ \emph{et} finissant par $b$. \thingy Si $L$ est un langage sur l'alphabet $\Sigma$, autrement dit $L \subseteq \Sigma^*$, on peut former le langage $\Sigma^*\setminus L$, parfois noté simplement $\overline L$ si ce n'est pas ambigu, dit \textbf{complémentaire} de $L$, et qui est simplement l'ensemble des mots sur $\Sigma$ \emph{n'appartenant pas} à $L$. L'opération correspondante sur les propriétés de mots est la négation logique. À titre d'exemple, sur $\Sigma=\{a,b\}$, si $L$ est le langage des mots commençant par $a$, alors $\overline{L}$ est le langage des mots ne commençant pas par $a$, c'est-à-dire, la réunion de $\{\varepsilon\}$ et du langage des mots commençant par $b$ (car sur $\Sigma=\{a,b\}$, un mot ne commençant pas par $a$ est vide ou bien commence par $b$). \thingy Si $L_1$ et $L_2$ sont deux langages sur un même alphabet $\Sigma$ (autrement dit, $L_1,L_2 \subseteq \Sigma^*$), on peut former le langage \textbf{concaténation} $L_1 L_2$ : il est défini comme l'ensemble des mots $w$ qui peuvent s'écrire comme concaténation d'un mot $w_1$ de $L_1$ et d'un mot $w_2$ de $L_2$, soit \[ \begin{aligned} L_1 L_2 &= \{w_1 w_2 : w_1 \in L_1,\, w_2 \in L_2\}\\ &= \{w \in \Sigma^* : \exists w_1 \in L_1\, \exists w_2 \in L_2\,(w = w_1 w_2)\}\\ \end{aligned} \] À titre d'exemple, sur l'alphabet $\Sigma = \{a,b,c,d\}$, si on a $L_1 = \{a,bb\}$ et $L_2 = \{bc, cd\}$ alors $L_1 L_2 = \{abc, acd, bbbc, bbcd\}$. \thingy Si $L$ est un langage sur l'alphabet $\Sigma$, autrement dit $L \subseteq \Sigma^*$, et si $r \in \mathbb{N}$, on peut définir un langage $L^r$, par analogie avec \ref{powers-of-a-word}, comme le langage $L^r = \{w_1\cdots w_r : w_1,\ldots,w_r \in L\}$ formé des concaténation de $r$ mots appartenant à $L$, ou si on préfère, par récurrence : \begin{itemize} \item $L^0 = \{\varepsilon\}$, \item $L^{r+1} = L^r L$. \end{itemize} À titre d'exemple, sur l'alphabet $\Sigma = \{a,b,c,d\}$, si on a $L = \{a,bb\}$, alors $L^2 = \{aa, abb, bba, bbbb\}$ et $L^3 = \{aaa, aabb, abba, abbbb, \penalty-100 bbaa, bbabb, bbbba, bbbbbb\}$. \emph{Attention}, $L^r$ n'est pas le langage $\{w^r : w\in L\}$ formé des répétitions $r$ fois ($w^r$) des mots $w$ de $L$ : c'est le langage des concaténations de $r$ mots appartenant à $L$ \emph{mais ces mots peuvent être différents}. À titre d'exemple, si $L = \{a,b\}$ alors $L^r$ est le langage formé des $2^r$ mots de longueur exactement $r$ sur $\{a,b\}$, ce n'est pas l'ensemble à deux éléments $\{a^r, b^r\}$ formé des seuls deux mots $a^r = aaa\cdots a$ et $b^r = bbb\cdots b$. \thingy Si $L$ est un langage sur l'alphabet $\Sigma$, on définit enfin l'\textbf{étoile de Kleene} $L^*$ de $L$ comme le langage formé des concaténations d'un nombre \emph{quelconque} de mots appartenant à $L$, c'est-à-dire \[ \begin{aligned} L^* &= \bigcup_{r=0}^{+\infty} L^r = \bigcup_{r\in\mathbb{N}} L^r\\ &= \{w_1\cdots w_r : r\in\mathbb{N},\, w_1,\ldots,w_r\in L\}\\ \end{aligned} \] Comme ci-dessus, il faut souligner que les mots $w_1,\ldots,w_r$ concaténés n'ont pas à être égaux : notamment, $\{a,b\}^*$ est le langage formé de tous les mots sur l'alphabet $\{a,b\}$, pas le langage $\{a\}^* \cup \{b\}^*$ formé des mots obtenus en répétant la lettre $a$ ou en répétant la lettre $b$. On remarquera que la définition de $L^*$ ci-dessus redonne bien, lorsqu'on l'applique à l'alphabet $\Sigma$ lui-même (considéré comme langage des mots de longueur $1$), l'ensemble $\Sigma^*$ de tous les mots : la notation $\Sigma^*$ est donc justifiée \textit{a posteriori}. Le mot vide appartient toujours à $L^*$ (quel que soit $L$) puisque $L^0 = \{\varepsilon\}$ et qu'on peut prendre $r=0$ ci-dessus (autrement dit, le mot vide est la concaténation de zéro mots de $L$). \thingy\label{kleene-plus} On introduit parfois la notation $L^+ = \bigcup_{r=1}^{+\infty} L^r = \{w_1\cdots w_r : r>0,\penalty-100\, w_1,\ldots,w_r\in L\}$ pour l'ensemble des mots formés par concaténation d'un nombre \emph{non nul} de mots de $L$. Lorsque le mot vide $\varepsilon$ n'appartient pas déjà à $L$, ce langage $L^+$ diffère de $L^*$ seulement en ce qu'il ne contient pas $\varepsilon$ ; tandis que si $\varepsilon$ appartient déjà à $L$, alors $L^+$ est égal à $L^*$. En toute généralité, on a $L^+ = LL^*$. \subsection{Langages rationnels et expressions rationnelles} \thingy Soit $\Sigma$ un alphabet. On va considérer les langages de base triviaux suivants : \begin{itemize} \item le langage vide $\varnothing$, \item le langage formé du seul mot vide, $\{\varepsilon\}$, et \item les langages formés d'un seul mot lui-même formé d'une seule lettre, $\{x\}$ pour chaque $x\in\Sigma$, \end{itemize} et on va les combiner par les opérations dites « rationnelles » suivantes : \begin{itemize} \item la réunion $(L_1,L_2) \mapsto L_1 \cup L_2$, \item la concaténation $(L_1,L_2) \mapsto L_1 L_2$, et \item l'étoile de Kleene $L \mapsto L^*$. \end{itemize} On obtient ainsi une certaine famille de langages (cf. ci-dessous pour une définition plus précise), qu'on appelle \textbf{langages rationnels} : les langages rationnels sont exactement ceux qui peuvent s'obtenir à partir des langages de base énumérés ci-dessus par application (un nombre fini de fois) des opérations qu'on vient de dire (i.e., la réunion de deux langages rationnels, ou la concaténation de deux langages rationnels, ou l'étoile de Kleene d'un langage rationnel, sont rationnels, et les langages rationnels sont exactement ceux qu'on obtient ainsi). À titre d'exemple, sur l'alphabet $\{a,b,c,d\}$, comme le langage $\{c\}$ (formé du seul mot $c$) est rationnel, son étoile de Kleene, c'est-à-dire $\{c\}^* = \{\varepsilon, c, cc, ccc, cccc,\ldots\}$, est rationnel, et comme $\{d\}$ l'est aussi, la concaténation $\{d\}(\{c\}^*) = \{d, dc, dcc, dccc, \ldots\}$ est encore un langage rationnel. {\footnotesize\thingy Formellement, la définition des langages rationnelles est la suivante : un ensemble $\mathscr{C} \subseteq \mathscr{P}(\Sigma^*)$ de langages (où $\mathscr{P}(\Sigma^*)$ est l'ensemble des parties de $\Sigma^*$, i.e., l'ensemble de tous les langages sur $\Sigma$) est dit \emph{stable par opérations rationnelles} lorsqu'il est stable par les opérations de réunion, concaténation et étoile de Kleene, i.e., si $L_1,L_2 \in \mathscr{C}$ alors $L_1\cup L_2 \in \mathscr{C}$ et $L_1 L_2 \in \mathscr{C}$, et si $L \in \mathscr{C}$ alors $L^* \in \mathscr{C}$ ; le \emph{plus petit} (pour l'inclusion) ensemble de langages stable par opérations rationnelles et contenant les langages $\varnothing$, $\{\varepsilon\}$ et $\{x\}$ pour $x \in \Sigma$ (i.e. $\varnothing\in\mathscr{C}$, $\{\varepsilon\} \in \mathscr{C}$ et si $x\in\Sigma$ alors $\{x\}\in\mathscr{C}$), ou plus exactement, l'intersection de tous les ensembles $\mathscr{C}$ vérifiant tous ces propriétés, est la classe $\mathscr{R}$ des langages rationnels. \par} \thingy Pour décrire la manière dont un langage rationnel est fabriqué (à partir des langages de base par les opérations rationnelles), comme il est malcommode d'écrire quelque chose comme $\{d\}(\{c\}^*)$, on introduit un nouvel objet, les \textbf{expressions rationnelles} (certains préfèrent le terme d'\textbf{expressions régulières}), qui sont des expressions servant à désigner un langage rationnel. Par exemple, plutôt que d'écrire « $\{d\}(\{c\}^*)$ », on parlera du langage désigné par l'expression rationnelle $dc{*}$. Plus exactement, une expression rationnelle (sur un alphabet $\Sigma$) est un mot sur l'alphabet $\Sigma \cup \{\bot, \underline{\varepsilon}, {(}, {)}, {|}, {*}\}$, où $\bot, \underline{\varepsilon}, {(}, {)}, {|}, {*}$ sont de nouveaux caractères \emph{n'appartenant pas} à l'alphabet $\Sigma$, appelés \textbf{métacaractères}, et qui servent à marquer la manière dont est formée l'expression rationnelle. On définit simultanément la notion d'expression rationnelle $r$ et de \textbf{langage désigné} $L_r$ par l'expression $r$, de la manière suivante : \begin{itemize} \item $\bot$ est une expression rationnelle et son langage désigné est $L_\bot := \varnothing$, \item $\underline{\varepsilon}$ est une expression rationnelle et son langage désigné est $L_{\underline{\varepsilon}} := \{\varepsilon\}$, \item si $x\in\Sigma$ est une lettre de l'alphabet $\Sigma$, alors le mot $x$ est une expression rationnelle et son langage désigné est $L_x := \{x\}$, \item si $r_1,r_2$ sont deux expressions rationnelles et $L_1 = L_{r_1}$ et $L_2 = L_{r_2}$ les langages désignés correspondants, alors $r_1 r_2$ est une expression rationnelle et son langage désigné est $L_{r_1 r_2} := L_1 L_2$, \item si $r_1,r_2$ sont deux expressions rationnelles et $L_1 = L_{r_1}$ et $L_2 = L_{r_2}$ les langages désignés correspondants, alors $(r_1|r_2)$ est une expression rationnelle et son langage désigné est $L_{(r_1|r_2)} := L_1\cup L_2$, \item si $r$ est une expression rationnelle et $L = L_r$ les langage désigné correspondant, alors $(r){*}$ est une expression rationnelle et son langage désigné est $L_{(r){*}} := L^*$. \end{itemize} À titre d'exemple, sur l'alphabet $\Sigma = \{a,b,c,d\}$, $c$ est une expression rationnelle qui désigne le langage $\{c\}$, donc $(c){*}$ en est une qui désigne le langage $\{c\}^* = \{\varepsilon, c, cc, ccc,\ldots\}$, et enfin $d(c){*}$ en est une qui désigne le langage $\{d, dc, dcc, \ldots\}$ des mots formés d'un $d$ et d'une succession quelconques de $c$. Voici quelques autres exemples, toujours sur $\Sigma = \{a,b,c,d\}$ : \begin{itemize} \item l'expression rationnelle $(a|b)$ désigne le langage $\{a\} \cup \{b\} = \{a,b\}$ formé des deux mots d'une seule lettre $a$ et $b$ ; \item l'expression rationnelle $(a|b)c$ désigne le langage $\{a,b\}\{c\} = \{ac,bc\}$, de même que $(ac|bc)$ ; \item l'expression rationnelle $(bc){*}$ désigne le langage $\{bc\}^* = \{\varepsilon, bc, bcbc, bcbcbc, \ldots\}$ ; \item l'expression rationnelle $(a|(bc){*})$ désigne le langage $\{a\} \cup \{bc\}^* = \{a, \varepsilon, bc, bcbc, bcbcbc, \ldots\}$ ; \item l'expression rationnelle $(a|(bc){*})d$ désigne le langage $\{a, d, bcd, bcbcd, bcbcbcd, \ldots\}$. \end{itemize} Un langage rationnel est par construction la même chose qu'un langage pour lequel il existe une expression rationnelle qui le désigne. On dira qu'un mot $w$ \textbf{vérifie} une expression rationnelle $r$ lorsque ce mot appartient au langage qu'elle désigne (i.e., $w \in L_r$). Par exemple, $dccc$ vérifie l'expression rationnelle $d(c){*}$. La convention de parenthésage introduite ci-dessus est inambiguë mais parfois inutilement lourde : on se permettra parfois de l'alléger, par exemple d'écrire $(r_1|r_2|r_3)$ pour $((r_1|r_2)|r_3)$ (ou pour $(r_1|(r_2|r_3))$, ce qui n'a guère d'importance vu qu'elles désignent le même langage), ou encore $x{*}$ pour $(x){*}$ lorsque $x$ est formé d'un seul caractère. La convention essentielle est que l'opération d'étoile ${*}$ est la plus prioritaire ($ab{*}$ se lit comme $a(b){*}$ et non pas comme $(ab){*}$), la concaténation vient après, et la barre de disjonction $|$ est la moins prioritaire ($ab|cd$ se lit comme $(ab|cd)$ et pas comme $a(b|c)d$). {\footnotesize Les métacaractères $\bot$ et $\underline{\varepsilon}$ sont introduits ici par souci de complétude mais font rarement utilisés dans les expressions rationnelles (le métacaractère $\underline{\varepsilon}$ a été souligné parce qu'il s'agit d'une vraie lettre et non pas du mot vide ; on peut ignorer cette subtilité qui n'a que très peu d'importance).\par} La barre de disjonction que nous avons notée ${|}$ est souvent plutôt notée $+$ par les mathématiciens. Il y a ici un risque de confusion lié au fait que, en informatique, le symbole \texttt{+} est utilisé par de nombreux moteurs d'expressions régulières (par exemple, \texttt{egrep}) pour désigner l'opération évoquée en \ref{kleene-plus} (de sorte que $r+$ a le même sens que $rr{*}$). \section{Automates finis} \setcounter{comcnt}{0} \thingy Les automates finis sont un modèle de calcul particulièrement simple et particulièrement appropriés à l'étude et à l'analyse des langages rationnels. Il faut imaginer un automate fini comme une machine disposant d'une quantité finie (et sous-entendu, très limitée) de mémoire : la configuration complète de cette mémoire est décrite par un \emph{état}, qui appartient à un ensemble fini d'états possibles. L'automate prendra une décision (passer dans un nouvel état) en fonction de son état actuel et de la lettre qu'on lui donne à consommer. \subsection{Automates finis déterministes (=DFA)} \thingy\label{definition-dfa} Un \textbf{automate fini déterministe}, ou en abrégé \textbf{DFA} (pour \textit{deterministic finite automaton}), sur un alphabet $\Sigma$ est la donnée \begin{itemize} \item d'un ensemble fini $Q$ dont les éléments sont appelés \textbf{états}, \item d'un état $q_0 \in Q$ appelé \textbf{état initial}, \item d'un ensemble $F \subseteq Q$ d'états appelés états \textbf{finaux}\footnote{Le pluriel de « final » est indifféremment « finaux » ou « finals ».} ou \textbf{acceptants}, \item d'une fonction $\delta \colon Q\times\Sigma \to Q$ appelée \textbf{fonction de transition}. \end{itemize} \thingy Graphiquement, on représente un DFA comme un graphe orienté aux arêtes étiquetées par des éléments de $\Sigma$ : plus exactement, on trace un nœud pour chaque élément $q \in Q$, et lorsque $\delta(q,x) = q'$ on introduit une flèche $q \to q'$ étiquetée par la lettre $x$. La condition sur $\delta$ (pour être un DFA) est alors que, pour chaque état $q \in Q$ et chaque lettre $x \in \Sigma$, il existe une unique arête partant de $q$ et étiquetée par $x$. En outre, on introduit une flèche pointant de nulle part vers $q_0$, et pour chaque $q\in F$ une flèche pointant de $q$ vers nulle part\footnote{Certains auteurs préfèrent d'autres conventions, par exemple celle consistant à entourer deux fois les états finaux.}. Lorsque plusieurs arêtes étiquetées par des symboles $x,y$ différents relient les mêmes sommets $q,q'$ (i.e., lorsqu'on a à la fois $\delta(q,x) = q'$ et $\delta(q,y) = q'$), on pourra écrire « $x,y$ » ou « $x|y$ » sur l'arête en question (et ne la tracer qu'une seule fois). Voir \ref{discussion-example2} ci-dessous pour un exemple. \thingy\label{discussion-example1} Pour donner un exemple simple, l'automate sur $\Sigma = \{a,b\}$ représenté ci-dessous a $Q = \{0,1\}$ et $q_0 = 0$ et $F = \{1\}$ et la fonction de transition $\delta$ donnée par $\delta(0,a) = 0$ et $\delta(0,b) = 1$ et $\delta(1,a) = 1$ et $\delta(1,b) = 0$. On pourra se convaincre (une fois lues les définitions plus loin) que cet automate accepte les mots dont le nombre de $b$ est pair. \begin{center} %%% begin example1 %%% \begin{tikzpicture}[>=latex,line join=bevel,automaton] %% \node (q1) at (98bp,20.306bp) [draw,circle,state,final] {$1$}; \node (q0) at (18bp,20.306bp) [draw,circle,state,initial] {$0$}; \draw [->] (q1) ..controls (75.212bp,3.6347bp) and (64.284bp,-1.3057bp) .. (54bp,1.3057bp) .. controls (50.042bp,2.3107bp) and (46.047bp,3.8633bp) .. node[auto] {$b$} (q0); \draw [->] (q0) ..controls (46.106bp,20.306bp) and (58.578bp,20.306bp) .. node[auto] {$b$} (q1); \draw [->] (q1) to[loop above] node[auto] {$a$} (q1); \draw [->] (q0) to[loop above] node[auto] {$a$} (q0); % \end{tikzpicture} %%% end example1 %%% \end{center} \thingy Il faut comprendre le fonctionnement d'un DFA de la manière suivante : initialement, l'automate est dans l'état initial $q_0$. On va lui présenter un mot $w \in \Sigma^*$, lettre par lettre, de la gauche vers la droite : i.e., si $w = x_1\cdots x_n$ on va faire consommer à l'automate les lettres $x_1,x_2,\ldots,x_n$ dans cet ordre. Le fait de consommer une lettre $x$ fait passer l'automate de l'état $q$ à l'état $\delta(q,x)$ (autrement dit, l'automate passe successivement dans les états $q_0$ puis $q_1 := \delta(q_0,x_1)$ puis $q_2 := \delta(q_1,x_2)$, et ainsi de suite jusqu'à $q_n := \delta(q_{n-1},x_n)$) ; on dit que l'automate effectue les transitions $q_0\to q_1$ (en consommant $x_1$) puis $q_1\to q_2$ (en consommant $x_2$) et ainsi de suite. Si $q_n$ est l'état dans lequel se trouve l'automate une fois qu'il a consommé le mot $w$, on dira que l'automate \emph{acepte} ou \emph{rejette} le mot selon que $q_n \in F$ ou que $q_n \not\in F$. Graphiquement, on peut présenter la procédure de la manière suivante : on part de l'état $q_0$ (sommet du graphe représentant l'automate) indiqué par la flèche entrante (pointant de nulle part), et pour chaque lettre du mot $w = x_1\cdots x_n$ considéré, on suit l'arête portant ce symbole (et partant de l'état où on se trouve actuellement). Si à la fin l'état $q_n$ est acceptant (représenté par une flèche pointant vers nulle part), le mot $w$ est accepté, sinon il est rejeté. \thingy\label{definition-multiple-transition-function} Formellement : si $A = (Q,q_0,F,\delta)$ est un DFA sur l'alphabet $\Sigma$, on définit une fonction $\delta^* \colon Q\times\Sigma^* \to Q$ par $\delta^*(q,x_1\cdots x_n) = \delta(\cdots\delta(\delta(q,x_1),x_2)\cdots,x_n)$ ou, ce qui revient au même (par récurrence sur la longueur du second argument) : \begin{itemize} \item $\delta^*(q,\varepsilon) = q$ quel que soit $q\in Q$ (où $\varepsilon$ désigne le mot vide), \item $\delta^*(q,wx) = \delta(\delta^*(q,w),x)$ quels que soient $q\in Q$, $w\in\Sigma^*$ et $x\in\Sigma$, \end{itemize} (en particulier, $\delta^*(q,x) = \delta(q,x)$ si $x\in\Sigma$, donc avec la convention faite en \ref{convention-on-words-of-length-one}, on peut dire que $\delta^*$ prolonge $\delta$). Cette fonction $\delta^*$ étant définie, on dira que l'automate $A$ \textbf{accepte} ou \textbf{reconnaît} un mot $w$ lorsque $\delta^*(q_0,w) =: q_n \in F$ ; dans le cas contraire, on dira qu'il \textbf{rejette} le mot $w$. \thingy\label{definition-recognizable-language} L'ensemble $L_A$ des mots acceptés par l'automate $A$ s'appelle \textbf{langage accepté}, ou \textbf{reconnu}, ou \textbf{défini}, par l'automate $A$. Un langage $L \subseteq \Sigma^*$ qui peut s'écrire sous la forme du langage $L_A$ accepté par un DFA $A$ s'appelle \textbf{reconnaissable} (sous-entendu : par automate déterministe fini). On dit que deux DFA $A,A'$ sont \textbf{équivalents} lorsqu'ils reconnaissent le même langage, i.e., $L_A = L_{A'}$. \thingy\label{discussion-example2} L'automate fini ci-dessous sur $\Sigma := \{a,b,c\}$ a trois états, $Q = \{0,1,2\}$. On peut en faire la description informelle suivante : l'automate commence dans l'état $0$, où il reste jusqu'à rencontrer un $a$ qui le fait passer dans l'état $1$, où il reste ensuite jusqu'à rencontrer un $b$ qui le fait passer dans l'état $2$, où il reste définitivement et qui constitue un état acceptant. \begin{center} %%% begin example2 %%% \begin{tikzpicture}[>=latex,line join=bevel,automaton] %% \node (q1) at (98bp,18bp) [draw,circle,state] {$1$}; \node (q0) at (18bp,18bp) [draw,circle,state,initial] {$0$}; \node (q2) at (178bp,18bp) [draw,circle,state,final] {$2$}; \draw [->] (q0) ..controls (46.106bp,18bp) and (58.578bp,18bp) .. node[auto] {$a$} (q1); \draw [->] (q1) to[loop above] node[auto] {$a,c$} (q1); \draw [->] (q1) ..controls (126.11bp,18bp) and (138.58bp,18bp) .. node[auto] {$b$} (q2); \draw [->] (q0) to[loop above] node[auto] {$b,c$} (q0); \draw [->] (q2) to[loop above] node[auto] {$a,b,c$} (q2); % \end{tikzpicture} %%% end example2 %%% \end{center} Cette description rend claire le fait que l'automate en question accepte exactement les mots contenant un $a$ suivi, pas forcément immédiatement, d'un $b$ ; autrement dit, les mots dont $ab$ est un sous-mot (cf. \ref{definition-subword}). Ce langage est donc reconnaissable. (Il est aussi rationnel puisque désigné par l'expression rationnelle $(b|c){*}a(b|c){*}b(a|b|c){*}$.) \thingy\label{definition-dfa-accessible-state} Un état $q$ d'un DFA est dit \textbf{accessible} lorsqu'il existe un mot $w \in \Sigma^*$ tel que $q = \delta(q_0,w)$, autrement dit, graphiquement, lorsqu'il existe un chemin orienté $q_0,q_1,\ldots,q_n=q$ reliant l'état initial $q_0$ à l'état $q$ considéré : bref, cela correspond à un état auquel il est possible que l'automate arrive (en partant de l'état initial et en consommant un certain mot). Dans le cas contraire, l'état est dit \textbf{inaccessible}. Il est évident qu'ajouter ou supprimer (ou modifier) les états inaccessibles dans un DFA ne change rien au langage reconnu au sens où on obtient des langages équivalents. Par exemple, dans le DFA qui suit, l'état $2$ est inaccessible (l'automate est donc équivalent à celui représenté en \ref{discussion-example1}). On remarquera qu'il ne change rien que cet état soit final ou non. \begin{center} %%% begin example1b %%% \begin{tikzpicture}[>=latex,line join=bevel,automaton] %% \node (q1) at (98bp,20.306bp) [draw,circle,state,final] {$1$}; \node (q0) at (18bp,20.306bp) [draw,circle,state,initial] {$0$}; \node (q2) at (172bp,20.306bp) [draw,circle,state,final] {$2$}; \draw [->] (q1) ..controls (75.212bp,3.6347bp) and (64.284bp,-1.3057bp) .. (54bp,1.3057bp) .. controls (50.042bp,2.3107bp) and (46.047bp,3.8633bp) .. node[auto] {$b$} (q0); \draw [->] (q0) ..controls (46.106bp,20.306bp) and (58.578bp,20.306bp) .. node[auto] {$b$} (q1); \draw [->] (q1) to[loop above] node[auto] {$a$} (q1); \draw [->] (q0) to[loop above] node[auto] {$a$} (q0); % \end{tikzpicture} %%% end example1b %%% \end{center} \thingy On va maintenant introduire différentes variations sur le thème des automates finis, c'est-à-dire différentes généralisations de la définition faite en \ref{definition-dfa} correspondant à des types d'automates finis plus puissants que les DFA mais dont on va montrer, à chaque fois, qu'ils peuvent se ramener à des DFA au sens où pour chacun de ces automates généralisés on pourra construire algorithmiquement un DFA qui reconnaît le même langage (si bien que la classe des langages reconnaissables par n'importe laquelle de ces sortes d'automates sera toujours la même). Les plus simples sont les automates déterministes finis incomplets et on va donc commencer par eux. \subsection{Automates finis déterministes à spécification incomplète (=DFAI)} \thingy Un \textbf{automate fini déterministe à spécification incomplète} ou \textbf{...partielle}, ou simplement \textbf{automate fini déterministe incomplet}, en abrégé \textbf{DFAI}, sur un alphabet $\Sigma$ est la donnée \begin{itemize} \item d'un ensemble fini $Q$ d'états, \item d'un état initial $q_0 \in Q$, \item d'un ensemble $F \subseteq Q$ d'états finaux, \item d'une fonction de transition \emph{partielle}\footnote{Une « fonction partielle » $f\colon X\dasharrow Y$, où $X, Y$ sont deux ensembles est, par définition, la même chose qu'une fonction $f\colon D\to Y$ où $D\subseteq X$ est un sous-ensemble de $X$ appelé \textbf{ensemble de définition} de $f$.} $\delta \colon Q\times\Sigma \dasharrow Q$, \end{itemize} autrement dit, la seule différence avec la définition faite en \ref{definition-dfa} est que la fonction $\delta$ est partielle, ce qui signifie qu'elle n'est pas obligatoirement définie sur tout couple $(q,x) \in Q\times\Sigma$. \thingy Graphiquement, on représente un DFAI comme un DFA, à la différence près que pour chaque $q\in Q$ et chaque $x\in \Sigma$, il y a maintenant \emph{au plus une} (et non plus exactement une) arête partant de $q$ et étiquetée par $x$. \thingy Le fonctionnement d'un DFAI est le même que celui d'un DFA, à la modification suivante près : si on donne à consommer à l'automate un symbole pour lequel la transition n'est pas définie, i.e., s'il rencontre un $x$ pendant qu'il se trouve dans un état $q$ pour lequel $\delta(q,x)$ n'est pas défini, alors l'automate cesse de fonctionner : l'automate n'a plus d'état, n'effectue plus de transition, et n'acceptera pas le mot quelles que soient les lettres ultérieures. \thingy Formellement : si $A = (Q,q_0,F,\delta)$ est un DFAI sur l'alphabet $\Sigma$, on définit une fonction $\delta^* \colon Q\times\Sigma^* \dasharrow Q$ par $\delta^*(q,x_1\cdots x_n) = \delta(\cdots\delta(\delta(q,x_1),x_2)\cdots,x_n)$ avec la convention que dès qu'une sous-expression n'est pas définie, toute l'expression n'est pas définie, ou, ce qui revient au même (par récurrence sur la longueur du second argument) : \begin{itemize} \item $\delta^*(q,\varepsilon) = q$ quel que soit $q\in Q$ (où $\varepsilon$ désigne le mot vide), \item $\delta^*(q,wx) = \delta(\delta^*(q,w),x)$ à condition que $q' := \delta^*(q,w)$ soit défini et que $\delta(q',x)$ le soit (et si ces deux conditions ne sont pas satisfaites, $\delta^*(q,wx)$ n'est pas défini). \end{itemize} Enfin, l'automate $A$ accepte un mot $w$ lorsque $\delta^*(q_0,w)$ \emph{est défini} et appartient à $F$ ; dans le cas contraire (que ce soit parce que $\delta^*(q_0,w)$ n'est pas défini ou parce qu'étant défini il n'appartient pas à $F$), l'automate rejette le mot. Le langage accepté $L_A$ et l'équivalence de deux automates sont définis de façon analogue aux DFA (cf. \ref{definition-recognizable-language}). \thingy\label{discussion-example2b} Voici un exemple de DFAI sur l'alphabet $\Sigma = \{a,b,c\}$. Cet automate reconnaît exactement les mots formés d'un nombre quelconque de $c$, suivis d'un $a$, suivis d'un nombre quelconque de $c$, suivis d'un $b$, suivis d'un nombre quelconque de $c$. \begin{center} %%% begin example2b %%% \begin{tikzpicture}[>=latex,line join=bevel,automaton] %% \node (q1) at (98bp,18bp) [draw,circle,state] {$1$}; \node (q0) at (18bp,18bp) [draw,circle,state,initial] {$0$}; \node (q2) at (178bp,18bp) [draw,circle,state,final] {$2$}; \draw [->] (q0) ..controls (46.106bp,18bp) and (58.578bp,18bp) .. node[auto] {$a$} (q1); \draw [->] (q1) to[loop above] node[auto] {$c$} (q1); \draw [->] (q1) ..controls (126.11bp,18bp) and (138.58bp,18bp) .. node[auto] {$b$} (q2); \draw [->] (q0) to[loop above] node[auto] {$c$} (q0); \draw [->] (q2) to[loop above] node[auto] {$c$} (q2); % \end{tikzpicture} %%% end example2b %%% \end{center} (Ce langage est aussi désigné par l'expression rationnelle $c{*}ac{*}bc{*}$.) \begin{prop} Soit $A = (Q,q_0,F,\delta)$ un DFAI sur un alphabet $\Sigma$. Alors il existe un DFA $A' = (Q',q'_0,F',\delta')$ (sur le même alphabet $\Sigma$) qui soit équivalent à $A$ au sens où il reconnaît le même langage $L_{A'} = L_A$. De plus, $A'$ se déduit algorithmiquement de $A$ en ajoutant au plus un état \textbf{puits} à $A$ : on a $\#Q' \leq \#Q + 1$. \end{prop} \begin{proof} On définit $Q' = Q \cup \{q_\bot\}$ où $q_\bot$ est un nouvel état (n'appartenant pas à $Q$), qu'on appellera « puits ». On garde l'état initial $q'_0 = q_0$. On garde l'ensemble $F' = F$ d'états finaux, c'est-à-dire notamment que le puits n'est pas acceptant. Enfin, on définit $\delta'(q,x)$ pour $q\in Q'$ et $x\in\Sigma$ par \[ \begin{aligned} \delta'(q,x) &= \delta(q,x)\text{ si $\delta(q,x)$ est défini}\\ \delta'(q,x) &= q_\bot\text{ sinon}\\ \end{aligned} \] (notamment, $\delta'(q_\bot,x) = q_\bot$ quel que soit $x$). Il est alors facile de voir que $A'$ a le même comportement que $A$ au sens où $\delta^{\prime*}(q,w) = \delta^*(q,w)$ lorsque le terme de droite est défini et $\delta^{\prime*}(q,w) = q_\bot$ sinon (le DFA $A'$ « tombe dans le puits » lorsque le DFAI $A$ cesse de fonctionner). En particulier, ils reconnaissent les mêmes langages. \end{proof} \thingy On dit que le DFA $A'$ est obtenu en \textbf{complétant} le DFAI $A$ lorsqu'il est obtenu par la procédure décrite dans la démonstration de cette proposition, c'est-à-dire par l'addition d'un état puits, sauf si $A$ est déjà complet, auquel cas on convient qu'il est son propre complété (i.e., on n'ajoute un puits que quand c'est réellement nécessaire). \thingy À titre d'exemple, le DFA suivant représente la complétion du DFAI représenté en \ref{discussion-example2b} : \begin{center} %%% begin example2c %%% \begin{tikzpicture}[>=latex,line join=bevel,automaton] %% \begin{scope} \pgfsetstrokecolor{black} \definecolor{strokecol}{rgb}{1.0,1.0,1.0}; \pgfsetstrokecolor{strokecol} \definecolor{fillcol}{rgb}{1.0,1.0,1.0}; \pgfsetfillcolor{fillcol} \filldraw (0bp,0bp) -- (0bp,182bp) -- (214bp,182bp) -- (214bp,0bp) -- cycle; \end{scope} \node (q1) at (102bp,131bp) [draw,circle,state] {$1$}; \node (q0) at (18bp,85bp) [draw,circle,state,initial] {$0$}; \node (q2) at (196bp,85bp) [draw,circle,state,final] {$2$}; \node (qbot) at (102bp,22bp) [draw,circle,state] {$\bot$}; \draw [->] (q1) to[loop above] node[auto] {$c$} (q1); \draw [->] (q2) to[loop above] node[auto] {$c$} (q2); \draw [->] (qbot) to[loop below] node[auto] {$a,b,c$} (qbot); \draw [->] (q0) ..controls (44.565bp,65.359bp) and (61.506bp,52.343bp) .. node[auto] {$b$} (qbot); \draw [->] (q0) to[loop above] node[auto] {$c$} (q0); \draw [->] (q1) ..controls (102bp,96.993bp) and (102bp,73.356bp) .. node[auto] {$a$} (qbot); \draw [->] (q0) ..controls (46.061bp,100.18bp) and (63.141bp,109.76bp) .. node[auto] {$a$} (q1); \draw [->] (q2) ..controls (166.87bp,65.735bp) and (145.76bp,51.281bp) .. node[auto] {$a,b$} (qbot); \draw [->] (q1) ..controls (132.83bp,116.08bp) and (154.08bp,105.46bp) .. node[auto] {$b$} (q2); % \end{tikzpicture} %%% end example2c %%% \end{center} \thingy On définit un état accessible d'un DFAI comme pour un DFA (cf. \ref{definition-dfa-accessible-state}). On dira en outre d'un état $q$ d'un DFAI qu'il est \textbf{co-accessible} lorsqu'il existe un mot $w \in \Sigma^*$ tel que $\delta(q,w)$ soit défini et soit final, autrement dit, graphiquement, lorsqu'il existe un chemin orienté reliant l'état $q$ considéré à un état final (remarquer que les états finaux eux-mêmes sont co-accessibles : prendre $w=\varepsilon$ dans ce qu'on vient de dire). Un état non co-accessible est donc un état à partir duquel il est impossible de faire accepter le mot. Cette définition pourrait également être faite pour les DFA, mais pour les DFAI elle présente l'intérêt qu'on peut supprimer les états non co-accessibles dans un DFAI (ainsi, bien sûr, que toutes les transitions qui y conduisent). Un DFAI dont tous les états sont à la fois accessibles et co-accessibles (on les dit aussi \textbf{utiles}) est parfois appelé \textbf{émondé}. On peut émonder un DFAI en ne conservant que ses états utiles : ainsi, tout DFAI est équivalent à un DFAI émondé. \subsection{Automates finis non-déterministes (=NFA)} \thingy Un \textbf{automate fini non-déterministe}, en abrégé \textbf{NFA}, sur un alphabet $\Sigma$ est la donnée \begin{itemize} \item d'un ensemble fini $Q$ d'états, \item d'un ensemble $I \subseteq Q$ d'états dits initiaux, \item d'un ensemble $F \subseteq Q$ d'états dits finaux, \item d'une \emph{relation} de transition $\delta \subseteq Q \times \Sigma \times Q$ (c'est-à-dire une partie du produit cartésien $Q \times \Sigma \times Q$, i.e., un ensemble de triplets $(q,x,q') \in Q \times \Sigma \times Q$). \end{itemize} Autrement dit, on autorise maintenant un ensemble quelconque d'états initiaux, et de même, au lieu qu'un état $q$ et un symbole $x$ déterminent un unique état $q' = \delta(q,x)$, on a maintenant affaire à un ensemble quelconque de triplets $(q,x,q')$. \thingy Graphiquement, on représente un NFA comme un DFA comme un graphe orienté dont les nœuds sont les éléments de $Q$, et où on place une arête étiquetée $x$ de $q$ vers $q'$ pour chaque triplet $(q,x,q') \in \delta$ ; comme précédemment, on marque les états initiaux par une flèche entrante (i.e., pointant de nulle part) et les états finaux par une flèche sortante (i.e., pointant vers nulle part). \thingy Il faut comprendre le fonctionnement d'un NFA de la manière suivante : un mot $w = x_1\cdots x_n$ est accepté par l'automate lorsqu'\emph{il existe} un chemin conduisant d'\emph{un} état initial à un état final et dont les arêtes sont étiquetées par les lettres $x_1,\ldots,x_n$ de $w$ (dans l'ordre) ; autrement dit, $w$ est accepté lorsqu'\emph{il existe} $q_0,\ldots,q_n \in Q$ tels que $q_0 \in I$ et $q_n\in F$ et $(q_{i-1},x_i,q_i) \in \delta$ pour chaque $1\leq i\leq n$. Il existe plusieurs manières de reformuler ce comportement : on peut par exemple dire que l'automate est dans plusieurs états à la fois, qu'il commence dans tous les états initiaux à la fois, et qu'à chaque fois qu'il consomme un symbole $x$, il effectue toutes les transitions possibles à partir d'un état où et étiquetées par ce symbole, et qu'au bout du compte l'automate accepte le mot lorsqu'il est dans \emph{au moins un} état acceptant (même s'il est, par ailleurs, dans d'autres états). C'est cette façon de voir les choses qui conduira à l'équivalence entre NFA et DFA (cf. \ref{determinization-of-nfa}). Une autre façon de présenter les choses est que l'automate « devine » par quel état initial commencer, et à chaque symbole consommé, « devine » quelle transition effectuer, de manière à accepter le mot si c'est possible. En tout état de cause, la définition formelle va être donnée ci-dessous. \thingy Si $A = (Q,I,F,\delta)$ est un NFA sur l'alphabet $\Sigma$, on définit une relation $\delta^* \subseteq Q \times \Sigma^* \times Q$ par $(q,w,q') \in \delta^*$ lorsque $w = x_1\cdots x_n$ et qu'il existe $(q_0,\ldots,q_n)$ tels que $q_0 = q$ et $q_n = q'$ et $(q_{i-1},x_i,q_i) \in \delta$ pour chaque $1\leq i\leq n$ ; ou, ce qui revient au même (par récurrence sur la longueur de $w$) : \begin{itemize} \item $(q,\varepsilon,q') \in \delta^*$ si et seulement si $q'=q$, \item $(q,wx,q') \in \delta^*$ si et seulement si il existe $q^\sharp$ tel que $(q,w,q^\sharp) \in \delta^*$ et $(q^\sharp,x,q') \in \delta$. \end{itemize} Enfin, l'automate $A$ accepte un mot $w$ lorsqu'il existe $q_0\in I$ et $q_\infty\in F$ tels que $(q_0,w,q_\infty) \in \delta^*$. Le langage accepté $L_A$ et l'équivalence de deux automates sont définis de façon analogue aux DFA (cf. \ref{definition-recognizable-language}). \thingy\label{discussion-example4} Pour illustrer le fonctionnement des NFA, considérons l'automate à trois états sur $\Sigma=\{a,b\}$ représenté par la figure suivante : on a $Q = \{0,1,2\}$ avec $I=\{0\}$ et $F=\{2\}$ et $\delta = \{(0,a,0),\penalty0 (0,b,0),\penalty-100 (0,a,1),\penalty-50 (1,a,2),\penalty0 (1,b,2)\}$. \begin{center} %%% begin example4 %%% \begin{tikzpicture}[>=latex,line join=bevel,automaton] %% \node (q1) at (98bp,18bp) [draw,circle,state] {$1$}; \node (q0) at (18bp,18bp) [draw,circle,state,initial] {$0$}; \node (q2) at (188bp,18bp) [draw,circle,state,final] {$2$}; \draw [->] (q0) ..controls (46.106bp,18bp) and (58.578bp,18bp) .. node[auto] {$a$} (q1); \draw [->] (q1) ..controls (128.76bp,18bp) and (145.63bp,18bp) .. node[auto] {$a,b$} (q2); \draw [->] (q0) to[loop above] node[auto] {$a,b$} (q0); % \end{tikzpicture} %%% end example4 %%% \end{center} Cet automate n'est pas déterministe car il existe deux transitions étiquetées $a$ partant de l'état $0$. En considérant les différents chemins possibles entre $0$ et $2$ dans ce graphe, on comprend que le langage qu'il reconnaît est le langage des mots sur $\{a,b\}$ dont l'avant-dernière lettre est un $a$ (c'est aussi le langage désigné par l'expression rationnelle $(a|b){*}a(a|b)$). Une façon de présenter le non-déterminisme est que l'automate « devine », quand il est dans l'état $0$ et qu'on lui fait consommer un $a$, si ce $a$ sera l'avant-dernière lettre, et, dans ce cas, passe dans l'état $1$ pour pouvoir accepter le mot. \begin{prop}\label{determinization-of-nfa} Soit $A = (Q,I,F,\delta)$ un NFA sur un alphabet $\Sigma$. Alors il existe un DFA $A' = (Q',q'_0,F',\delta')$ (sur le même alphabet $\Sigma$) qui soit équivalent à $A$ au sens où il reconnaît le même langage $L_{A'} = L_A$. De plus, $A'$ se déduit algorithmiquement de $A$ avec une augmentation au plus exponentielle du nombre d'états : $\#Q' \leq 2^{\#Q}$. \end{prop} \begin{proof} On définit $Q' = \mathscr{P}(Q) = \{\mathbf{q} \subseteq Q\}$ l'\emph{ensemble des parties} de $Q$ : c'est ce qui servira d'ensemble d'états du DFA $A'$ qu'on construit (i.e., un état de $A'$ est un ensemble d'états de $A$ — intuitivement, c'est l'ensemble des états dans lesquels on se trouve simultanément). On pose $q'_0 = I$ et $F' = \{\mathbf{q}\subseteq Q :\penalty-100 \mathbf{q}\cap F \neq\varnothing\}$ l'ensemble des états de $A'$ qui, vus comme des ensembles d'états de $A$, contiennent \emph{au moins un} état final. Enfin, pour $\mathbf{q}\subseteq Q$ et $x \in \Sigma$, on définit $\delta'(\mathbf{q},x) = \{q_1\in Q : \exists q_0\in\mathbf{q} ((q_0,x,q_1) \in \delta)\}$ comme l'ensemble de tous les états $q_1$ de $A$ auxquels on peut accéder depuis un état $q_0$ dans $\mathbf{q}$ par une transition $(q_0,x,q_1)$ (étiquetée par $x$) de $A$. Il est alors facile de voir (par récurrence sur $|w|$) que $\delta^{\prime*}(\mathbf{q},w)$ est l'ensemble de tous les les états $q_1 \in Q$ tels que $(q_0,w,q_1)\in\delta^*$, i.e., auxquels on peut accéder depuis un état $q_0$ dans $\mathbf{q}$ par une suite de transitions de $A$ étiquetées par les lettres de $w$. En particulier, $\delta^{\prime*}(I,w)$ est l'ensemble de tous les états de $A$ auxquels on peut accéder depuis un état initial de $A$ par une suite de transitions de $A$ étiquetées par les lettres de $w$ : le mot $w$ appartient à $L_A$ si et seulement si cet ensemble contient un élément de $F$, ce qui par définition de $F'$ signifie exactement $\delta^{\prime*}(I,w) \in F'$. On a bien prouvé $L_{A'} = L_A$. Enfin, $\#Q' = \#\mathscr{P}(Q) = 2^{\#Q}$ (car une partie de $Q$ peut se voir comme sa fonction indicatrice, qui est une fonction $Q \to \{0,1\}$). \end{proof} \thingy On dit que le DFA $A'$ est obtenu en \textbf{déterminisant} le NFA $A$ lorsqu'il est obtenu par la procédure décrite dans la démonstration de cette proposition en ne gardant que les états accessibles. Algorithmiquement, la déterminisation de $A$ s'obtient par la procéduire suivante : \begin{itemize} \item créer une file (ou une pile) d'ensembles d'états de $A$ ; initialiser cette file avec le seul élément $I$ (vu comme un sous-ensemble de $Q$) ; et créer l'automate $A'$ avec initialement l'unique état $I$, marqué comme état initial, et aussi comme final s'il contient un état final de $A$ ; \item tant que la file/pile n'est pas vide : en extraire un élément $\mathbf{q}$, et, pour chaque lettre $x\in\Sigma$, \begin{itemize} \item calculer l'ensemble $\mathbf{q}' = \{q_1\in Q : \exists q_0\in\mathbf{q} ((q_0,x,q_1) \in \delta)\}$ (en listant tous les triplets $(q_0,x,q_1)$ dont le premier élément est dans $\mathbf{q}$ et le second élément est $x$), \item si $\mathbf{q}'$ n'existe pas déjà comme état de $A'$, l'y ajouter, et dans ce cas, l'ajouter à la file/pile, et de plus, si $\mathbf{q}'$ contient un état final de $A$, marquer cet état comme final pour $A'$, \item et ajouter à $A'$ la transition $\delta'(\mathbf{q},x) = \mathbf{q}'$. \end{itemize} \end{itemize} La file/pile sert à stocker les états de $A'$ qui ont été créés mais pour lesquels les transitions sortantes n'ont pas encore été calculées. L'algorithme se termine quand la file/pile se vide, ce qui se produit toujours en au plus $2^{\#Q}$ étapes car chaque $\mathbf{q} \subseteq Q$ ne peut apparaître qu'une seule fois dans la file/pile. Il se peut que l'état $\varnothing$ soit créé : cet état servira effectivement de puits, au sens où on aura $\delta'(\varnothing,x) = \varnothing$ quel que soit $x$ (et l'état n'est pas acceptant). Il arrive souvent que l'automate déterminisé soit plus petit que les $2^{\#Q}$ états qu'il a dans le pire cas. \thingy À titre d'exemple, déterminisons le NFA $A$ présenté en \ref{discussion-example4} : on commence par construire un état $\{0\}$ pour $A'$ car le NFA a $\{0\}$ pour ensemble d'états initiaux ; on a $\delta'(\{0\},a) = \{0,1\}$ car $0$ et $1$ sont les deux états auxquels on peut arriver dans $A$ par une transition partant de $0$ et étiquetée par $a$, tandis que $\delta'(\{0\},b) = \{0\}$ ; ensuite, $\delta'(\{0,1\},a) = \{0,1,2\}$ car $0,1,2$ sont les trois états auxquels on peut arriver dans $A$ par une transition partant de $0$ ou $1$ et étiquetée par $a$ ; et ainsi de suite. En procédant ainsi, on constuit l'automate à $4$ états qui suit : \begin{center} \footnotesize %%% begin example4det %%% \begin{tikzpicture}[>=latex,line join=bevel,automaton] %% \begin{scope} \pgfsetstrokecolor{black} \definecolor{strokecol}{rgb}{1.0,1.0,1.0}; \pgfsetstrokecolor{strokecol} \definecolor{fillcol}{rgb}{1.0,1.0,1.0}; \pgfsetfillcolor{fillcol} \filldraw (0bp,0bp) -- (0bp,155bp) -- (212bp,155bp) -- (212bp,0bp) -- cycle; \end{scope} \node (q02) at (188bp,19bp) [draw,circle,state,final] {$\{0,2\}$}; \node (q0) at (18bp,40bp) [draw,circle,state,initial] {$\{0\}$}; \node (q01) at (100bp,71bp) [draw,circle,state] {$\{0,1\}$}; \node (q012) at (188bp,98bp) [draw,circle,state,final] {$\{0,1,2\}$}; \draw [->] (q01) ..controls (129.79bp,53.593bp) and (147.53bp,42.867bp) .. node[auto] {$b$} (q02); \draw [->] (q0) ..controls (45.781bp,50.378bp) and (59.874bp,55.839bp) .. node[auto] {$a$} (q01); \draw [->] (q0) to[loop above] node[auto] {$b$} (q0); \draw [->] (q01) ..controls (129.27bp,79.877bp) and (142.8bp,84.122bp) .. node[auto] {$a$} (q012); \draw [->] (q012) to[loop above] node[auto] {$a$} (q012); \draw [->] (q02) ..controls (146.97bp,21.169bp) and (110.83bp,23.684bp) .. (80bp,28bp) .. controls (68.696bp,29.582bp) and (56.322bp,31.905bp) .. node[auto] {$a,b$} (q0); \draw [->] (q012) ..controls (188bp,65.926bp) and (188bp,56.965bp) .. node[auto] {$b$} (q02); % \end{tikzpicture} %%% end example4det %%% \end{center} On remarquera qu'on a construit moins que les $2^3 = 8$ états qu'on pouvait craindre. Il est par ailleurs instructif de regarder comment fonctionne l'automate $A'$ ci-dessus pour déterminer si l'avant-dernière lettre d'un mot est un $a$ : intuitivement, l'état $\{0\}$ mémorise l'information « la dernière lettre n'était pas un $a$, et la précédente ne l'était pas », l'état $\{0,1\}$ mémorise « la dernière lettre était un $a$, mais la précédente ne l'état pas », l'état $\{0,1,2\}$ mémorise « les deux dernières lettres étaient des $a$ », et l'état $\{0,2\}$ mémorise « la dernière lettre était un $b$, mais la précédente était un $a$ ». \subsection{Automates finis non-déterministes à transitions spontanées (=εNFA)} \thingy Un \textbf{automate fini non-déterministe à transitions spontanées} ou \textbf{...à $\varepsilon$-transitions}, en abrégé \textbf{εNFA}, sur un alphabet $\Sigma$ est la donnée \begin{itemize} \item d'un ensemble fini $Q$ d'états, \item d'un ensemble $I \subseteq Q$ d'états dits initiaux, \item d'un ensemble $F \subseteq Q$ d'états dits finaux, \item d'une relation de transition $\delta \subseteq Q \times (\Sigma\cup\{\varepsilon\}) \times Q$. \end{itemize} Autrement dit, on autorise maintenant des transitions étiquetées par le mot vide $\varepsilon$ plutôt que par une lettre $x \in\Sigma$ : ces transitions sont dites spontanées, ou $\varepsilon$-transitions. Soulignons qu'on ne définit les $\varepsilon$-transitions \emph{que} pour les automates non-déterministes : ou, pour dire les choses autrement, \emph{un automate qui possède des $\varepsilon$-transitions est par nature même non-déterministe}. La représentation graphique des εNFA est évidente (on utilisera le symbole « $\varepsilon$ » pour étiqueter les transitions spontanées). \thingy Un εNFA accepte un mot $w$ lorsqu'il existe un chemin conduisant d'un état initial à un état final et dont les arêtes sont étiquetées par les lettres de $w$ ou bien des $\varepsilon$ insérés à n'importe quel endroit et en n'importe quel nombre. Autrement dit, $w$ est accepté lorsqu'\emph{il existe} $q_0,\ldots,q_n \in Q$ et $t_1,\ldots,t_n \in (\Sigma\cup\{\varepsilon\})$ tels que $q_0 \in I$ et $q_n\in F$ et $(q_{i-1},t_i,q_i) \in \delta$ pour chaque $1\leq i\leq n$ et $w = t_1\cdots t_n$ (\emph{attention} : dans cette écriture, $t_1,\ldots,t_n$ ne sont pas forcément les lettres de $w$, certains des $t_i$ peuvent être le symbole $\varepsilon$, les lettres de $w$ sont obtenues en ignorant ces symboles). De façon plus intuitive, cela signifie que l'automate a la possibilité de passer spontanément, c'est-à-dire sans consommer de lettre, d'un état $q$ à un état $q'$, lorsque ces états sont reliés par une ε-transition. \thingy Voici une formalisation possible : si $A = (Q,I,F,\delta)$ est un εNFA sur l'alphabet $\Sigma$, on définit une relation $\delta^* \subseteq Q \times \Sigma^* \times Q$ par $(q,w,q') \in \delta^*$ lorsqu'il existe $q_0,\ldots,q_n \in Q$ et $t_1,\ldots,t_n \in (\Sigma\cup\{\varepsilon\})$ tels que $q_0 = q$ et $q_n = q'$ et $(q_{i-1},t_i,q_i) \in\delta$ pour chaque $1\leq i\leq n$, et enfin $w = t_1\cdots t_n$. Si on préfère, on peut définir par récurrence sur $n \geq 0$ une relation $\delta^{(n)} \subseteq Q \times \Sigma^* \times Q$ de la manière suivante : \begin{itemize} \item $(q,w,q') \in \delta^{(0)}$ si et seulement si $q'=q$ et $v=\varepsilon$, \item $\delta^{(1)} = \delta \subseteq Q \times (\Sigma\cup\{\varepsilon\})$ (faisant partie de la donnée de $A$), \item $(q,v,q') \in \delta^{(n+1)}$ si et seulement si il existe $q^\sharp \in Q$ et $t \in \Sigma\cup\{\varepsilon\}$ tels que $(q,w,q^\sharp) \in \delta^{(n)}$ et $(q^\sharp,t,q') \in \delta$ et $v = wt$ (ce qui signifie que : soit $t=\varepsilon$ et $v=w$, soit $t\in\Sigma$ est la dernière lettre de $w$ et $v$ est le préfixe correspondant) ; \end{itemize} et on définit $\delta^* = \bigcup_{n=1}^{+\infty} \delta^{(n)}$, autrement dit $(q,w,q') \in \delta^*$ lorsqu'il existe $n$ tel que $(q,w,q') \in \delta^{(n)}$. Concrètement, $(q,w,q') \in \delta^{(n)}$ signifie que le εNFA peut passer de l'état $q$ à l'état $q'$ en effectuant (exactement) $n$ transitions ($q_0\to q_1 \to \cdots \to q_n$ étiquetées par $t_1,\ldots,t_n \in (\Sigma\cup\{\varepsilon\})$) et en consommant le mot $w$ (soit $w = t_1\cdots t_n$) ; et $(q,w,q') \in \delta^*$ signifie la même chose mais sans contrainte sur le nombre de transitions. La différence avec les NFA est que le nombre $n$ de transitions n'est plus forcément égal à la longueur de $w$. Enfin, l'automate $A$ accepte un mot $w$ lorsqu'il existe $q_0\in I$ et $q_\infty\in F$ tels que $(q_0,w,q_\infty) \in \delta^*$. Le langage accepté $L_A$ et l'équivalence de deux automates sont définis de façon analogue aux DFA (cf. \ref{definition-recognizable-language}). \thingy\label{discussion-example5} Voici un exemple de εNFA particulièrement simple sur $\Sigma = \{a,b,c\}$: \begin{center} %%% begin example5 %%% \begin{tikzpicture}[>=latex,line join=bevel,automaton] %% \node (q1) at (98bp,18bp) [draw,circle,state] {$1$}; \node (q0) at (18bp,18bp) [draw,circle,state,initial] {$0$}; \node (q2) at (178bp,18bp) [draw,circle,state,final] {$2$}; \draw [->] (q0) ..controls (46.106bp,18bp) and (58.578bp,18bp) .. node[auto] {$\varepsilon$} (q1); \draw [->] (q1) to[loop above] node[auto] {$b$} (q1); \draw [->] (q1) ..controls (126.11bp,18bp) and (138.58bp,18bp) .. node[auto] {$\varepsilon$} (q2); \draw [->] (q0) to[loop above] node[auto] {$a$} (q0); \draw [->] (q2) to[loop above] node[auto] {$c$} (q2); % \end{tikzpicture} %%% end example5 %%% \end{center} En considérant les différents chemins possibles entre $0$ et $2$ sur ce graphe, on comprend que le langage qu'il reconnaît est celui des mots sur $\{a,b,c\}$ formés d'un nombre quelconque de $a$ suivi d'un nombre quelconque de $b$ suivi d'un nombre quelconque de $c$, ou, si on préfère, le langage désigné par l'expression rationnelle $a{*}b{*}c{*}$. \thingy Si $q$ est un état d'un εNFA, on appelle \textbf{$\varepsilon$-fermeture} de $q$ l'ensemble des états $q'$ (y compris $q$ lui-même) accessibles depuis $q$ par une succession quelconque de ε-transitions, c'est-à-dire, si on veut, $\{q'\in Q :\penalty0 (q,\varepsilon,q') \in\delta^*\}$. On notera temporairement $C(q)$ cet ensemble. (Par exemple, dans l'exemple \ref{discussion-example5} ci-dessus, on a $C(0) = \{0,1,2\}$ et $C(1) = \{1,2\}$ et $C(2) = \{2\}$. Dans tout NFA sans ε-transitions, on a $C(q) = \{q\}$ pour tout état $q$.) % % % \end{document}