%% This is a LaTeX document. Hey, Emacs, -*- latex -*- , get it? \documentclass[mathserif,a4paper,aspectratio=169]{beamer} %\documentclass[a4paper]{article} %\usepackage[envcountsect,noxcolor]{beamerarticle} \usepackage[shorthands=off,french]{babel} \usepackage[utf8]{inputenc} \usepackage[T1]{fontenc} \usepackage{lmodern} \DeclareUnicodeCharacter{00A0}{~} \DeclareUnicodeCharacter{2026}{...} \DeclareUnicodeCharacter{1E25}{\d{h}} % Beamer theme: \usetheme{Goettingen} %\usecolortheme{albatross} %\usecolortheme{lily} %\setbeamercovered{transparent} % A tribute to the worthy AMS: \usepackage{amsmath} \usepackage{amsfonts} \usepackage{amssymb} \usepackage{amsthm} % \usepackage{mathrsfs} \usepackage{mathpartir} % \usepackage{graphicx} \usepackage{tikz} \usetikzlibrary{arrows,automata,calc} % \newcommand{\itempoint}{\strut\hbox{\color{beamerstructure}\donotcoloroutermaths$\blacktriangleright$}\nobreak\hskip.5em plus.5em\relax} \renewcommand{\thefootnote}{\textdagger} \newcommand{\dbllangle}{\mathopen{\langle\!\langle}} \newcommand{\dblrangle}{\mathclose{\rangle\!\rangle}} % % % \title{Typage simple} \subtitle{INF110 (Logique et Fondements de l'Informatique)} \author[David Madore]{David A. Madore\\ {\footnotesize Télécom Paris}\\ \texttt{david.madore@enst.fr}} \date{2023–2024} \mode{% \beamertemplatenavigationsymbolsempty \usenavigationsymbolstemplate{\vbox{\hbox{\footnotesize\hyperlinkslideprev{$\leftarrow$}\insertframenumber/\inserttotalframenumber\hyperlinkslidenext{$\rightarrow$}}}} } \setbeamercolor{myhighlight}{fg=black,bg=white!90!green} \begin{document} \mode
{\maketitle} % \setlength\abovedisplayskip{2pt plus 2pt minus 2pt} \setlength\belowdisplayskip{2pt plus 2pt minus 2pt} % \begin{frame} \titlepage {\footnotesize\center{\url{http://perso.enst.fr/madore/inf110/transp-inf110.pdf}}\par} {\tiny \immediate\write18{sh ./vc > vcline.tex} \begin{center} Git: \input{vcline.tex} \end{center} \immediate\write18{echo ' (stale)' >> vcline.tex} \par} \end{frame} % \section*{Plan} \begin{frame} \frametitle{Plan} \tableofcontents \end{frame} % \section{Généralités sur le typage} \begin{frame} \frametitle{Qu'est-ce que le typage ?} {\footnotesize Philosophie opposée du « codage de Gödel » en calculabilité, lequel représente toute donnée finie par un entier.\par} \medskip \itempoint Informellement, un \textbf{système de typage} est une façon d'affecter à toute \alert{expression} et/ou \alert{valeur} manipulée par un langage informatique un \textbf{type} qui contraint son usage {\footnotesize (p.ex., « entier », « fonction », « chaîne de caractères »)}. \medskip \textbf{Buts :} \begin{itemize} \item attraper plus tôt des \textbf{erreurs de programmation} {\footnotesize (« ajouter un entier et une chaîne de caractères » est probablement une erreur, ou demande une conversion explicite)}, \item éviter des \textbf{plantages ou problèmes de sécurité} {\footnotesize (exécution d'un entier)}, \item garantir certaines \textbf{propriétés du comportement} des programmes ($\rightarrow$ analyse statique), forcément de façon limitée (cf. théorème de Rice), p.ex., la \alert{terminaison}, \item aider à l'\textbf{optimisation} {\footnotesize (fonction pure : sans effet de bord)}. \end{itemize} \medskip {\footnotesize Cf. systèmes d'unités (homogénéité) en physique.\par} \end{frame} % \begin{frame} \frametitle{Variétés de typage} Il y a autant de systèmes de typage que de langages de programmation ! \medskip \itempoint Typage \textbf{statique} (à compilation) vs \textbf{dynamique} (à exécution) ou mixte. {\footnotesize Mixte = « graduel ». On préfère : erreur de compilation $>$ erreur à l'exécution $>$ plantage.\par} \medskip \itempoint Typage \textbf{inféré} par le langage ou \textbf{annoté} par le programmeur. {\footnotesize Type = promesse donnée par le langage au programmeur ou par le programmeur au langage ?\par} \medskip \itempoint Typage « sûr » ou partiel/contournable (\textit{cast} de la valeur, manipulation de la représentation mémoire, suppression ou report à l'exécution de vérification). \medskip \itempoint Typage superficiel {\footnotesize (« ceci est une liste »)} ou complexe {\footnotesize (« ceci est une liste d'entiers »)}. \medskip \itempoint Diverses annotations possibles {\footnotesize (« cette fonction est pure », « soulève une exception »)}. \medskip \itempoint Liens avec les mécanismes de sécurité (qui peut faire quoi ?), de gestion de la mémoire (système de typage linéaire), l'évaluation (exceptions), la mutabilité. \medskip \itempoint Les types sont-ils citoyens de première classe {\footnotesize (:= manipulables dans le langage)} ? {\footnotesize Juvénal : « Quis custodiet ipsos custodes? » Quel est le type des types eux-mêmes ?\par} \end{frame} % \begin{frame} \frametitle{Opérations de base sur les types} En plus de types de base (p.ex. $\texttt{Nat}$ = entiers, $\texttt{Bool}$ = booléens), les opérations suivantes sur les types sont \emph{souvent} proposées par les systèmes de typage : \bigskip \itempoint Types \textbf{produits} (= couples, triplets, $k$-uplets). P.ex. $\texttt{Nat} \times \texttt{Bool}$ = type des paires formées d'un entier et d'un booléen. \smallskip Composantes éventuellement nommées $\rightarrow$ structures (= enregistrements). \smallskip Produit vide = type trivial, $\texttt{Unit}$ (une seule valeur). \bigskip \itempoint Types \textbf{sommes} (= unions). P.ex. $\texttt{Nat} + \texttt{Bool}$ = type pouvant contenir un entier \emph{ou} un booléen, avec un \alert{sélecteur} de cas. \smallskip Cas particulier : $\texttt{Unit} + \cdots + \texttt{Unit}$ = type « énumération » (pur sélecteur). \smallskip Somme vide = type inhabité (impossible : aucune valeur). \bigskip \itempoint Types \textbf{fonctions} (= exponentielles). P.ex. $\texttt{Nat} \rightarrow \texttt{Bool}$ (f\textsuperscript{n} de $\texttt{Nat}$ vers $\texttt{Bool}$). \bigskip \itempoint Types \textbf{listes}. P.ex. $\texttt{List}~\texttt{Nat}$ = type des listes d'entiers. \end{frame} % \begin{frame} \frametitle{Quelques fonctionnalités fréquentes} \itempoint \textbf{Sous-typage} = les valeurs d'un type sont automatiquement des valeurs possibles d'un autre. \bigskip \itempoint \textbf{Polymorphisme} = utilisation de plusieurs types possibles, voire de n'importe quel type (cf. transp. suivant). P.ex. la fonction « identité » $(\forall\mathtt{t})\; \mathtt{t} \rightarrow \mathtt{t}$. \bigskip \itempoint \textbf{Constructeurs de types} = fabriquent un type à partir d'un (ou plusieurs) autres. P.ex. $\texttt{List}$ (fabrique le type « liste de $\mathtt{t}$ » à partir de $\mathtt{t}$). \bigskip \itempoint \textbf{Types récursifs} = construits par les opérateurs (produits, sommes, fonctions, constructeurs…) à partir des types définis eux-mêmes. P.ex. $\texttt{Tree} = \texttt{List}~\texttt{Tree}$. \bigskip \itempoint \textbf{Types dépendants} = un type à partir d'une valeur. P.ex. $k \mapsto \texttt{Nat}^k$. \bigskip \itempoint \textbf{Types opaques} (abstraits, privés…) = types dont les valeurs sont cachées, l'usage est limité à une interface publique. \end{frame} % \begin{frame} \frametitle{Polymorphisme} On distingue deux (trois ?) sortes de polymorphismes : \medskip \itempoint Polymorphisme \textbf{paramétrique} (ou « génériques ») : la même fonction \alert{s'applique à l'identique} à une donnée de n'importe quel type. \smallskip Exemples : \begin{itemize} \item $\texttt{head} : (\forall\mathtt{t})\; \texttt{List}~\mathtt{t} \to \mathtt{t}$ (renvoie le premier élément d'une liste) \item $\lambda xy.\langle x,y\rangle : (\forall\mathtt{u},\mathtt{v})\; \mathtt{u} \to \mathtt{v} \to \mathtt{u}\times \mathtt{v}$ (fabrique un couple) \item $\lambda xyz.xz(yz) : (\forall\mathtt{u},\mathtt{v},\mathtt{w})\; (\mathtt{u} \to \mathtt{v} \to \mathtt{w}) \to (\mathtt{u} \to \mathtt{v}) \to \mathtt{u} \to \mathtt{w}$ \end{itemize} \smallskip Pas seulement pour les fonctions ! $\texttt{[]} : (\forall\mathtt{t})\; \texttt{List}~\mathtt{t}$ (liste vide) \smallskip {\footnotesize Et même : $\texttt{while~true~do~pass~done} : (\forall\mathtt{t})\; \mathtt{t}$ (boule infinie)\par} \bigskip \itempoint Polymorphisme \textbf{ad hoc} (ou « surcharge » / « \textit{overloading} ») : la fonction \alert{agit différemment} en fonction du type de son argument (connu à la compilation !). \bigskip {\footnotesize Le sous-typage est parfois considéré comme une forme de polymorphisme, voire la coercion (\textit{cast}). Les limites de ces notions sont floues.\par} \end{frame} % \begin{frame} \frametitle{Tâches d'un système de typage} \itempoint \textbf{Vérification} de type : vérifier qu'une expression \emph{annotée} a bien le type prétendu par les annotations. \bigskip \itempoint \textbf{Inférence} (« reconstruction » / « assignation ») de type : calculer le type de l'expression \alert{en l'absence d'annotations} (ou avec annotations partielles). \medskip Algorithme important : \textbf{Hindley-Milner} (inférence de type dans les langages fonctionnels à polymorphisme paramétrique). Utilisé dans OCaml, Haskell, etc. \medskip \textbf{N.B.} Dans un système de typage trop complexe, l'inférence (voire la vérification !) \textcolor{orange}{peut devenir indécidable} (notamment si types de première classe / dépendant de valeurs arbitraires à l'exécution). \bigskip {\footnotesize Rarement utile en informatique mais essentiel en logique ($\cong$ recherche de preuves) :\par} \itempoint \textbf{Habitation} de type : trouver un \alert{terme} (=expression) ayant un type donné. {\footnotesize P.ex. : y a-t-il un terme de type $(\forall\mathtt{p},\mathtt{q})\; ((\mathtt{p} \to \mathtt{q}) \to \mathtt{p}) \to \mathtt{p}$ ?\par} {\footnotesize \textbf{N.B.} Dans les langages usuels, \alert{tous} les types sont habités par une boucle infinie (« \texttt{while true do pass done} » ou « \texttt{let rec f () = f () in f ()} »), \alert{même} le type vide.\par} \end{frame} % \begin{frame} \frametitle{Utilisations du typage au-delà des valeurs stockées} \itempoint Annotation des \textbf{exceptions soulevables} (fréquent, p.ex. Java). \bigskip \itempoint Annotation de la \textbf{mutabilité} par le type. P.ex. $\texttt{Nat}$ = type d'un entier (immuable) mais $\texttt{Ref~Nat}$ = type d'une \alert{référence} vers un entier (mutable). \bigskip \itempoint Annotation des \textbf{effets de bord} par le type. P.ex., en Haskell, $\texttt{Char}$ = caractère = fonction de zéro argument renvoyant un caractère (fonction pure : toujours le même retour), mais $\texttt{IO~Char}$ = \alert{action} avec effets de bord renvoyant un caractère ($\texttt{IO}$ est un constructeur de type appelé « monade » I/O). \bigskip \itempoint Typage \textbf{linéaire} (forme de typage « sous-structurel ») ou types à unicité : assure qu'une valeur est utilisée \alert{une et une seule fois} dans un calcul (ni duplication ni perte sauf manœuvre spéciale). \smallskip Permet d'optimiser la gestion de la mémoire (Rust) et/ou d'annoter les effets de bord (Clean). \end{frame} % \begin{frame} \frametitle{Quelques exemples (1)} Les langages impératifs \emph{tendent} à avoir des systèmes de typage moins complexes que les langages fonctionnels. \medskip {\footnotesize Éviter les termes de typage « faible » et « fort », qui veulent tout (ou rien) dire.\par} \medskip \itempoint Assembleur (langage machine) : aucun typage (tout est donnée binaire). {\footnotesize Idem : machine de Turing, fonctions générales récursives (tout est entier), $\lambda$-calcul non typé (tout est fonction).\par} \medskip \itempoint C : annoté, vérifié à la compilation (\emph{aucune} vérification à l'exécution), moyennement complexe et contournable (pointeurs génériques \texttt{void*}). \medskip \itempoint Python, JavaScript, Perl, Scheme, etc. : typage vérifié à l'exécution, superficiel. Suffisant pour éviter les comportements indéfinis. \medskip \itempoint Java : annoté, mixte compilation/exécution (double vérification), initialement superficiel (listes non typées), puis introduction de « génériques » ($\rightarrow$ polymorphisme paramétrique) avec Java 5, puis diverses sortes d'inférence. \medskip \itempoint Rust : interaction avec la gestion de la mémoire ($\approx$ typage linéaire). \end{frame} % \begin{frame} \frametitle{Quelques exemples (2)} {\footnotesize Qqs exemples de langages, généralement fonctionnels, ayant un système de typage (très) complexe, mélangeant plusieurs fonctionnalités évoquées (interactions parfois délicates !) :\par} \medskip \itempoint OCaml : inférence de type à la H-M, types récursifs, polymor\textsuperscript{sme} paramétrique. \smallskip Système de « modules » (« signatures » $\approx$ interfaces abstraites, « foncteurs » entre signatures…), comparable aux « classes » des langages orientés objet. \medskip \itempoint Haskell : beaucoup de similarité avec OCaml : \smallskip + polymorphisme ad hoc : « classes de type », comparable aux « modules » de OCaml, aux « classes » des langages orientés objet. \smallskip + purement fonctionnel (toutes les fonctions sont « pures ») : les effets de bord sont enrobés dans des « monades ». \medskip \itempoint Mercury (langage de type fonctionnel+logique, inspiré de Haskell+Prolog) : typage comparable à Haskell ; + sous-typage, linéarité. \medskip \itempoint Idris : langage fonctionnel + assistant de preuve. \end{frame} % \begin{frame} \frametitle{Quelques curiosités} \itempoint En F\#, les unités de mesure sont intégrées au système de typage, qui peut donc vérifier l'homogénéité physique. \bigskip \itempoint En Rust, le système de typage évite non seulement les fuites de mémoire mais aussi certains problèmes de concurrence (absence de \textit{race condition} sur les données). \bigskip \itempoint Certains langages spécialisés assurent, éventuellement en lien avec leur système de typage, des propriétés diverses de leurs programmes : terminaison garantie en temps polynomial (Bellantoni \& Cook 1992), voire constant (langage Usuba), validation XML (langage CDuce), absence de fuite d'information (langage Flow Caml), etc. \bigskip \itempoint En Idris, le système de typage est aussi un système de preuve (cf. Curry-Howard après) et permet de certifier des invariants quelconques d'un programme (p.ex., correction d'un algorithme de tri). \end{frame} % \begin{frame} \label{typing-and-termination} \frametitle{Typage et terminaison} Un système de typage \alert{peut} garantir que \textbf{tout programme bien typé termine}. \bigskip Ce \alert{n'est pas le cas} pour les langages de programmation usuels (en OCaml, Haskell, etc., un programme bien typé peut faire une boucle infinie). \bigskip Si on veut que le système de typage soit décidable, ceci met forcément des \alert{limites sur l'expressivité} du langage ($\leftarrow$ indécidabilité du problème de l'arrêt). \bigskip Notamment, le langage ne permettra pas d'écrire son propre interpréteur (même argument « diagonal » que pour les fonctions p.r. par thm. de réc\textsuperscript{sion} de Kleene). \bigskip Notamment aussi : pas de boucle illimitée, pas d'appels récursifs \emph{non contraints}, pas de type tel que $\mathtt{t} \,\cong\, (\mathtt{t}\rightarrow \mathtt{t})$. Aucun terme de type vide ! \bigskip Néanmoins, le langage peut être \alert{beaucoup plus puissant} que les fonctions p.r. \bigskip Exemple de tel langage : Coq. \end{frame} % \begin{frame} \frametitle{La correspondance de Curry-Howard (avant-goût)} Idée générale : établir une analogie, voire une correspondance précise entre \begin{itemize} \item \textbf{types} et \textbf{termes} de ces types dans un système de typage, \item \textbf{propositions} et \textbf{preuves} de ces propositions dans un système logique. \end{itemize} \smallskip P.ex., la preuve évidente de l'affirmation $(A \land B) \Rightarrow A$ (« si $A$ et $B$ sont vraies alors $A$ est vraie ») correspond à la « première projection » de type $a \times b \rightarrow a$. \smallskip {\footnotesize Ceci « explique » que le type d'un terme tel que $\lambda xy.x$, soit $u \to v \to u$, soit une vérité logique, en l'occurrence $U \Rightarrow V \Rightarrow U$ (« si $U$ est vrai alors, si $V$ est vrai alors $U$ est vrai »).\par} \bigskip Beaucoup de variations sur cette correspondance, mais il y a des restrictions : \begin{itemize} \item le langage informatique doit garantir la terminaison, sinon cela reviendrait à permettre les preuves circulaires, \item la logique concernée est plutôt « intuitionniste » (sans tiers exclu), \item diverses subtilités notamment dans la correspondance entre types sommes paramétriques (types $\Sigma$) et $\exists$ côté logique. \end{itemize} \end{frame} % \begin{frame} \frametitle{La correspondance de Curry-Howard (premier aperçu)} {\footnotesize\textcolor{gray}{Divulgâchis pour la suite !}\par} \smallskip La correspondance de Curry-Howard fait notamment correspondre : \begin{itemize} \item type \textbf{fonction} $A \to B$ avec \textbf{implication} logique $A \Rightarrow B$, \item \textbf{application} d'une fonction ($A \to B$ à un argument de type $A$) avec \textbf{\textit{modus ponens}} (si $A \Rightarrow B$ et $A$, alors $B$), \item \textbf{abstraction} (= création d'une fonction) avec ouverture d'une \textbf{hypothèse} (« supposons $A$ : alors (…) donc $B$ ; ceci prouve $A \Rightarrow B$ »), \item type \textbf{produit} (= couples) $A \times B$ avec \textbf{conjonction} (« et ») logique $A \land B$, \item type \textbf{somme} $A + B$ avec \textbf{disjonction} (« ou ») logique $A \lor B$, \item types \textbf{trivial} ($\texttt{Unit}$) et \textbf{vide} avec \textbf{vrai} $\top$ et \textbf{faux} $\bot$ logiques, \item mais pour la \textbf{négation}… c'est plus délicat. \end{itemize} \bigskip {\footnotesize Les détails demandent un système de typage et un système logique précisément définis.\par} \end{frame} % \begin{frame} \frametitle{Paradoxe de Curry (interlude distrayant)} {\footnotesize Variante plus sophistiquée de « cette phrase est fausse ». C'est un exemple de preuve circulaire ($\leftrightarrow$ combinateur $\mathsf{Y}$ de Curry par la correspondance de C-H), invalide en logique.\par} \medskip Je tiens l'affirmation : « \textcolor{teal}{si j'ai raison, alors je suis un grand génie} ». \begin{itemize} \item clairement, si j'ai raison, je suis un grand génie ; \item mais c'était justement mon affirmation : donc j'ai raison ; \item donc je suis un grand génie. \qedsymbol \end{itemize} {\footnotesize Remplacer « j'ai raison » par « cette phrase est vraie » (voire utiliser l'astuce de Quine pour éviter « cette phrase ») et « je suis un grand génie » par absolument n'importe quoi.\par} \bigskip \itempoint Ce qui est correct : \alert{si on peut construire} un énoncé $A$ tel que $A \Leftrightarrow (A \Rightarrow B)$ (ici $A$ est l'affirmation tenue et $B$ est la conclusion voulue) alors $B$ vaut : \[ (A \Leftrightarrow (A \Rightarrow B)) \, \Rightarrow \, B \] {\footnotesize (Preuve correcte : supposons $A$ : par hypothèse, ceci signifie $A \Rightarrow B$ ; on a donc $B$ ; tout ceci prouve $A \Rightarrow B$. Bref on a $A \Rightarrow B$. Mais par hypothèse c'est $A$. Donc $A$ vaut. Donc $B$ aussi.)\par} \medskip \itempoint Ce qui est \textcolor{orange}{fallacieux} : la supposition tacite qu'on peut construire un tel $A$. {\footnotesize L'astuce de Quine permet de faire une auto-référence sur la syntaxe, pas sur la vérité.\par} \end{frame} % \begin{frame} \frametitle{Théories des types pour la logique (très bref aperçu)} \itempoint Langages spécialisés pour servir à la fois à l'écriture de programmes informatiques et de preuves mathématiques ; ils peuvent être soit sous forme de systèmes abstraits, soit sous forme d'implémentation informatique (« assistants de preuve » : Coq, Agda, Lean…). \bigskip \itempoint Dans tous les cas il s'agit de langages assurant la terminaison des programmes (cf. transp. \ref{typing-and-termination}), ou, puisqu'il s'agit de variantes du $\lambda$-calcul, la \emph{normalisation forte}. Le type vide doit être inhabité ! \bigskip Quelques grandes familles (chacune avec énormément de variantes) : \begin{itemize} \item théories des types à la Martin-Löf (« MLTT ») : suit jusqu'au bout la correspondance de Curry-Howard (\emph{aucune} distinction entre types et propositions ; {\footnotesize pas de $\exists$ mais plutôt un $\Sigma$}), $\rightarrow$ Agda ; \item variantes du « calcul des constructions » (« CoC »), $\rightarrow$ Coq ; \item théorie homotopique des types (« HoTT ») : « égalité = isomorphisme ». \end{itemize} \end{frame} % \begin{frame} \frametitle{Le $\lambda$-cube de Barendregt (très bref aperçu)} Il s'agit d'un ensemble de $8 = 2^3$ théories des types pour la logique : la plus faible est le « $\lambda$-calcul simplement typé » ($\lambda_\rightarrow$, décrit plus loin), la plus forte le « calcul des constructions » (« CoC »). \medskip Chaque théorie du cube est caractérisée par l'absence ou la présence de chacune des $3$ fonctionnalités suivantes ($\lambda_\rightarrow$ n'a aucune des trois, CoC a les trois) : \begin{itemize} \item \textcolor{blue}{termes pouvant dépendre de types}, ou polymorphisme paramétrique « explicitement quantifié » (p.ex. $\prod t.\; (t \rightarrow t)$) ; \item \textcolor{blue}{types pouvant dépendre de types}, ou constructeurs de types ; \item \textcolor{blue}{types pouvant dépendre de termes}, ou « types dépendants », correspondant côté logique à la quantification sur les individus. \end{itemize} \medskip {\footnotesize On peut ensuite encore ajouter des fonctionnalités : par exemple, Coq est basé sur le « calcul des constructions inductives » qui ajoute au calcul des constructions des mécanismes systématiques pour former des types (positivement !) récursifs.\par} \end{frame} % \section{Le \texorpdfstring{$\lambda$}{lambda}-calcul simplement typé} \begin{frame} \frametitle{Le $\lambda$-calcul simplement typé : description sommaire} \itempoint Le $\lambda$-calcul simplement typé (=: $\lambda$CST ou $\lambda_\rightarrow$) est une \alert{variante typée} du $\lambda$-calcul, assurant la propriété de terminaison (normalisation forte). \medskip \itempoint Il a une seule opération sur les types, le type \textbf{fonction} : donnés deux types $\sigma,\tau$, on a un type $\sigma\to\tau$ pour les fonctions de l'un vers l'autre. \medskip \itempoint L'application et l'abstraction doivent respecter le typage : \begin{itemize} \item si $P$ a pour type $\sigma\to\tau$ et $Q$ a type $\sigma$ alors $PQ$ a pour type $\tau$, \item si $E$ a pour type $\tau$ en faisant intervenir une variable $v$ libre de type $\sigma$ alors $\lambda(v:\sigma).E$ {\footnotesize (« fonction prenant $v$ de type $\sigma$ et renvoyant $E$ »)} a pour type $\sigma\to\tau$. \end{itemize} \medskip \itempoint Typage \textbf{annoté} (=« à la Church ») : on écrit $\lambda(v:\sigma).E$ pas juste $\lambda v.E$. \medskip \itempoint On notera « $x_1:\sigma_1,\ldots,x_k:\sigma_k \vdash E:\tau$ » pour dire « $E$ est bien typé avec pour type $\tau$ lorsque $x_1,\ldots,x_k$ sont des variables libres de types $\sigma_1,\ldots,\sigma_k$ : \begin{itemize} \item $x_1:\sigma_1,\ldots,x_k:\sigma_k$ s'appelle un \textbf{contexte} de typage (souvent $\Gamma$), \item $\Gamma \vdash E:\tau$ s'appelle un \textbf{jugement} de typage. \end{itemize} \end{frame} % \begin{frame} \frametitle{Exemples de termes et de typages} {\footnotesize On donnera les règles précises plus tard, commençons par quelques exemples.\par} \begin{itemize} \item $f:\alpha\to\beta,\; x:\alpha \;\vdash\; fx:\beta$\\ Lire : « dans le contexte où $f$ est une variable de type $\alpha\to\beta$ et $x$ une variable de type $\alpha$, alors $fx$ est de type $\beta$ ». \item $f:\beta\to\alpha\to\gamma,\; x:\alpha,\; y:\beta \;\vdash\; fyx : \gamma$\\ {\footnotesize (Parenthéser $\beta\to\alpha\to\gamma$ comme $\beta\to(\alpha\to\gamma)$ et $fyx$ comme $(fy)x$.)} \item $f:\beta\to\alpha\to\gamma,\; x:\alpha \;\vdash\; \lambda(y:\beta).fyx \;:\; \beta\to\gamma$\\ {\footnotesize Comprendre $\lambda(y:\beta).fyx$ comme « fonction prenant $y$ de type $\beta$ et renvoyant $fyx$ ».} \item $x:\alpha \;\vdash\; \lambda(f:\alpha\to\beta).fx\;:\;(\alpha\to\beta)\to\beta$\\ « Si $x$ est de type $\alpha$ alors le terme $\lambda(f:\alpha\to\beta).fx$ est de type $(\alpha\to\beta)\to\beta$. » \item $\vdash\; \lambda(x:\alpha). \lambda(f:\alpha\to\beta).fx\;:\;\alpha\to(\alpha\to\beta)\to\beta$\\ « Le terme $\lambda(x:\alpha).\lambda(f:\alpha\to\beta).fx$ a type $\alpha\to(\alpha\to\beta)\to\beta$ dans le contexte vide. »\\ {\footnotesize (Parenthéser $\alpha\to(\alpha\to\beta)\to\beta$ comme $\alpha\to((\alpha\to\beta)\to\beta)$.)} \end{itemize} \end{frame} % \begin{frame} \frametitle{Types et prétermes} \itempoint Un \textbf{type} du $\lambda$CST est (inductivement) : \begin{itemize} \item une \textbf{variable de type} ($\alpha$, $\beta$, $\gamma$... en nombre illimité), \item un \textbf{type fonction} $(\sigma\to\tau)$ où $\sigma$ et $\tau$ sont deux types. \end{itemize} \bigskip \itempoint Un \textbf{préterme} du $\lambda$CST est (inductivement) : \begin{itemize} \item une \textbf{variable de terme} ($a$, $b$, $c$... en nombre illimité), \item une \textbf{application} $(PQ)$ où $P$ et $Q$ sont deux termes, \item une \textbf{abstraction} $\lambda(v:\sigma).E$ où $v$ est une variable, $\sigma$ un type et $E$ un terme. \end{itemize} \medskip \itempoint Conventions d'écriture : \begin{itemize} \item « $\rho\to\sigma\to\tau$ » signifie « $(\rho\to(\sigma\to\tau))$ » ; « $xyz$ » signifie « $((xy)z)$ » ; \item on note « $\lambda (x:\sigma,t:\tau).E$ » pour « $\lambda (x:\sigma). \lambda (t:\tau). E$ » ; \item l'abstraction est moins prioritaire que l'application ; \item on considère les termes à renommage près des variables liées {\footnotesize ($\alpha$-conversion)}. \end{itemize} \end{frame} % \begin{frame} \frametitle{Règles de typage} \itempoint Un \textbf{typage} est la donnée d'un préterme $M$ et d'un type $\sigma$. On note « $M:\sigma$ ». \medskip \itempoint Un \textbf{contexte} est un ensemble fini $\Gamma$ de typages $x_i:\sigma_i$ où $x_1,\ldots,x_k$ sont des \alert{variables} de terme \alert{distinctes}. On le note « $x_1:\sigma_1,\ldots,x_k:\sigma_k$ ». \medskip \itempoint Un \textbf{jugement} de typage est la donnée d'un contexte $\Gamma$ et d'un typage $E:\tau$, sujet aux règles ci-dessous. On note $\Gamma \vdash E:\tau$ (ou juste $\vdash E:\tau$ si $\Gamma = \varnothing$), et on dit que $E$ est un « \textbf{terme} (= bien typé) de type $\tau$ dans le contexte $\Gamma$ ». \medskip \textbf{Règles} de typage du $\lambda$CST : {\footnotesize (quels que soient $\Gamma,x,\sigma,\ldots$,)} \begin{itemize} \item \textcolor{olive}{(« variable »)} si $(x:\sigma) \in \Gamma$ alors $\Gamma \vdash x:\sigma$ ; \item \textcolor{olive}{(« application »)} si $\Gamma \vdash P:\sigma\to\tau$ et $\Gamma \vdash Q:\sigma$ alors $\Gamma \vdash PQ:\tau$ ; \item \textcolor{olive}{(« abstraction »)} si $\Gamma, v:\sigma \vdash E:\tau$ alors $\Gamma \vdash \lambda(v:\sigma).E : \sigma\to\tau$. \end{itemize} \smallskip {\footnotesize (Comprendre : l'ensemble des jugements de typage est l'ensemble engendré par les règles ci-dessus, i.e., le plus petit ensemble qui les respecte.)\par} \medskip \itempoint Une \textbf{dérivation} d'un jugement est un arbre (d'instances de) règles qui aboutit au jugement considéré. \end{frame} % \begin{frame} \frametitle{Représentation des règles de typage} Les trois règles de typage du $\lambda$CST : \[ \inferrule*[left=\llap{Var}]{ }{\Gamma,x:\sigma \vdash x:\sigma} \] \[ \inferrule*[left=\llap{App},sep=4em]{\Gamma \vdash P:\sigma\to\tau\\ \Gamma \vdash Q:\sigma}{\Gamma \vdash PQ:\tau} \] \[ \inferrule*[left=\llap{Abs}]{\Gamma, v:\sigma \vdash E:\tau}{\Gamma \vdash \lambda(v:\sigma).E : \sigma\to\tau} \] \bigskip \itempoint Chaque « fraction » indique que le jugement écrit \alert{en-dessous} découle par la règle inscrite \alert{à côté} à partir des hypothèses portées \alert{au-dessus}. \end{frame} % \begin{frame} \frametitle{Exemple de dérivation} Montrons le jugement selon lequel $\lambda(f:\beta\to\alpha\to\gamma). \lambda(x:\alpha). \lambda(y:\beta). fyx$ est un terme de type $(\beta\to\alpha\to\gamma) \to (\alpha\to\beta\to\gamma)$ dans le contexte vide : \vskip-2ex {\footnotesize \[ \inferrule*[left=\llap{Abs}]{ \inferrule*[left=\llap{Abs}]{ \inferrule*[left=\llap{Abs}]{ \inferrule*[left=\llap{App}]{ \inferrule*[left=\llap{App}]{ \inferrule*[left=\llap{Var}]{ }{\mbox{$\begin{array}{cc}\scriptscriptstyle f:\beta\to\alpha\to\gamma,\\ \scriptscriptstyle x:\alpha,y:\beta\\ \end{array}$} \vdash f : \beta\to\alpha\to\gamma} \\ \inferrule*[right=\rlap{Var}]{ }{\mbox{$\begin{array}{cc}\scriptscriptstyle f:\beta\to\alpha\to\gamma,\\ \scriptscriptstyle x:\alpha,y:\beta\\ \end{array}$} \vdash y : \beta} }{\mbox{$\begin{array}{cc}\scriptscriptstyle f:\beta\to\alpha\to\gamma,\\ \scriptscriptstyle x:\alpha,y:\beta\\ \end{array}$} \vdash fy : \alpha\to\gamma} \\ \inferrule*[right=\rlap{Var}]{ }{\mbox{$\begin{array}{cc}\scriptscriptstyle f:\beta\to\alpha\to\gamma,\\ \scriptscriptstyle x:\alpha,y:\beta\\ \end{array}$} \vdash x : \alpha} }{f:\beta\to\alpha\to\gamma, x:\alpha, y:\beta \vdash fyx : \gamma} }{f:\beta\to\alpha\to\gamma, x:\alpha \vdash \lambda(y:\beta). fyx : \beta\to\gamma} }{f:\beta\to\alpha\to\gamma \vdash \lambda(x:\alpha). \lambda(y:\beta). fyx : \alpha\to\beta\to\gamma} }{\vdash \lambda(f:\beta\to\alpha\to\gamma). \lambda(x:\alpha). \lambda(y:\beta). fyx : (\beta\to\alpha\to\gamma) \to (\alpha\to\beta\to\gamma)} \] \par} Chaque barre horizontale justifie le jugement écrit \alert{en-dessous} par la règle inscrite \alert{à côté} à partir des hypothèses portées \alert{au-dessus}. \medskip Ceci est typographiquement abominable et hautement redondant, ce qui explique qu'on écrive rarement de tels arbres complètement. \end{frame} % \begin{frame} \frametitle{Propriétés du typage} Les propriétés suivantes sont faciles mais utiles : \medskip \itempoint \textbf{Affaiblissement :} si $\Gamma \subseteq \Gamma'$ sont deux contextes et $\Gamma \vdash M:\sigma$ alors $\Gamma' \vdash M:\sigma$ aussi. \smallskip {\footnotesize On pouvait présenter les règles en limitant la règle « variable » à « $x:\sigma \vdash x:\sigma$ » et en prenant l'affaiblissement comme règle. C'est peut-être préférable.\par} \medskip \itempoint \textbf{Duplication :} si $\Gamma, x:\rho, x':\rho \vdash M:\sigma$ alors $\Gamma, x:\rho \vdash M[x'\backslash x]:\sigma$ aussi (où $M[x'\backslash x]$ désigne la substitution correcte de $x'$ par $x$). \smallskip {\footnotesize \emph{Remarque :} Le typage linéaire supprime notamment l'affaiblissement et la duplication.\par} \medskip \itempoint \textbf{Variables libres :} si $x_1:\sigma_1,\ldots,x_k:\sigma_k \vdash E:\tau$ alors toute variable libre de $E$ est une des $x_1,\ldots,x_k$. \medskip \itempoint \textbf{Variables inutiles :} si $\Gamma \vdash E:\tau$ alors $\Gamma|_{\operatorname{free}(E)} \vdash E:\tau$ où $\Gamma|_{\operatorname{free}(E)}$ est la partie de $\Gamma$ concernant les variables libres de $E$. \medskip \itempoint \textbf{Renommage :} si $\Gamma \vdash E:\tau$ alors ceci vaut encore après tout renommage des variables libres. \end{frame} % \begin{frame} \frametitle{Construction de la dérivation} La dérivation du jugement de typage $\Gamma \vdash M : \sigma$ d'un (pré)terme $M$ du $\lambda$CST se construit systématiquement et évidemment à partir de $M$ (\alert{aucun choix} à faire !) : \begin{itemize} \item si $M = x$ est une variable, alors un $x:\sigma$ doit être dans le contexte $\Gamma$ (sinon : échouer), et la dérivation est par la règle « variable » ; \item si $M = PQ$ est une application, construire des dérivations de jugements $\Gamma \vdash P : \rho$ et $\Gamma \vdash Q : \sigma$, on doit avoir $\rho = (\sigma\to\tau)$ (sinon : échouer), et la dérivation est par la règle « application » ; \item si $M = \lambda(v:\sigma).E$ est une abstraction, construire une dérivation de jugement $\Gamma' \vdash E : \tau$ dans $\Gamma' := \Gamma \cup \{v:\sigma\}$ {\footnotesize (quitte à renommer $v$)}, et la dérivation est par la règle « abstraction ». \end{itemize} \bigskip \itempoint \textbf{Donc :} aussi bien la vérification de type (vérifier $\Gamma \vdash M : \sigma$) que l'assignation de type (trouver $\sigma$ à partir de $\Gamma,M$) sont (très facilement) \alert{décidables} dans le $\lambda$CST. De plus, $\sigma$ est \alert{unique} (donnés $\Gamma$ et $M$). \end{frame} % \begin{frame} \frametitle{Problèmes faciles et moins faciles} \itempoint Facile (transp. précédent) : donné un (pré)terme $M$, trouver son (seul possible) type $\sigma$ est facile (notamment : vérifier que $M$ est un terme = bien typé, ou vérifier un jugement de type). \smallskip \textcolor{blue}{Le terme donne directement l'arbre de dérivation.} \bigskip \itempoint Facile aussi : réciproquement, donné un arbre de dérivation où on a effacé les termes pour ne garder que les types, retrouver un terme (transp. suivant). \smallskip \textcolor{blue}{L'arbre de dérivation redonne directement le terme.} \bigskip \itempoint Moins facile : donné un terme « désannoté », i.e., un terme du $\lambda$-calcul non typé, p.ex. $\lambda xyz.xz(yz)$, savoir s'il correspond à un terme (typable) du $\lambda$CST. \smallskip \textcolor{brown}{$\rightarrow$ Algorithme de Hindley-Milner.} \bigskip \itempoint Moins facile : donné un type, savoir s'il existe un terme ayant ce type. \smallskip \textcolor{brown}{$\rightarrow$ Décidabilité du calcul propositionnel intuitionniste.} \end{frame} % \begin{frame} \frametitle{Reconstruction du terme typé} Peut-on retrouver les termes manquants dans un arbre de dérivation dont on n'a donné que les types et les règles appliquées ? {\footnotesize \[ \inferrule*[left=\llap{Abs}]{ \inferrule*[left=\llap{Abs}]{ \inferrule*[left=\llap{Abs}]{ \inferrule*[left=\llap{App}]{ \inferrule*[left=\llap{App}]{ \inferrule*[left=\llap{Var}]{ }{\mbox{$\begin{array}{cc}\scriptscriptstyle \textbf{?}:\beta\to\alpha\to\gamma,\\ \scriptscriptstyle \textbf{?}:\alpha,\textbf{?}:\beta\\ \end{array}$} \vdash \textbf{?} : \beta\to\alpha\to\gamma} \\ \inferrule*[right=\rlap{Var}]{ }{\mbox{$\begin{array}{cc}\scriptscriptstyle \textbf{?}:\beta\to\alpha\to\gamma,\\ \scriptscriptstyle \textbf{?}:\alpha,\textbf{?}:\beta\\ \end{array}$} \vdash \textbf{?} : \beta} }{\mbox{$\begin{array}{cc}\scriptscriptstyle \textbf{?}:\beta\to\alpha\to\gamma,\\ \scriptscriptstyle \textbf{?}:\alpha,\textbf{?}:\beta\\ \end{array}$} \vdash \textbf{?} : \alpha\to\gamma} \\ \inferrule*[right=\rlap{Var}]{ }{\mbox{$\begin{array}{cc}\scriptscriptstyle \textbf{?}:\beta\to\alpha\to\gamma,\\ \scriptscriptstyle \textbf{?}:\alpha,\textbf{?}:\beta\\ \end{array}$} \vdash \textbf{?} : \alpha} }{\textbf{?}:\beta\to\alpha\to\gamma, \textbf{?}:\alpha, \textbf{?}:\beta \vdash \textbf{?} : \gamma} }{\textbf{?}:\beta\to\alpha\to\gamma, \textbf{?}:\alpha \vdash \textbf{?} : \beta\to\gamma} }{\textbf{?}:\beta\to\alpha\to\gamma \vdash \textbf{?} : \alpha\to\beta\to\gamma} }{\vdash \textbf{?} : (\beta\to\alpha\to\gamma) \to (\alpha\to\beta\to\gamma)} \] \par} \textbf{Oui} (aux noms des variables près) à condition, en cas de types identiques dans le contexte, d'identifier l'élément utilisé pour chaque règle « variable ». \bigskip \itempoint\textcolor{blue}{Le terme typé représente exactement l'arbre de dérivation} du jugement le concernant. \end{frame} % \begin{frame} \frametitle{Lemme de substitution} \itempoint\textbf{Lemme :} Si $\Gamma, v:\sigma \vdash E : \tau$ et $\Gamma \vdash T : \sigma$ alors $\Gamma \vdash E[v\backslash T] : \tau$, où $E[v\backslash T]$ désigne le terme obtenu par substitution correcte de $v$ par $v$ dans $E$. \bigskip \underline{Esquisse de preuve :} reprendre l'arbre de dérivation de $\Gamma, v:\sigma \vdash E : \tau$ en supprimant $v:\sigma$ du contexte et en substituant $v$ par $E$ partout à droite du ‘$\vdash$’. Les règles s'appliquent à l'identique, sauf la règle « variable » introduisant $v:\sigma$, qui est remplacée par l'arbre de dérivation de $\Gamma \vdash T : \sigma$.\qed \medskip \centerline{*} \medskip Remarquer la similarité entre \[ \inferrule*[left=App]{ \inferrule*[left=Abs]{\Gamma, v:\sigma \vdash E : \tau}{ \Gamma \vdash \lambda(v:\sigma).E : \sigma\to\tau} \\ \Gamma \vdash T : \sigma }{\Gamma \vdash (\lambda(v:\sigma).E)T : \tau} \] et \[ \inferrule*[left=Subs]{\Gamma, v:\sigma \vdash E : \tau \\ \Gamma \vdash T : \sigma }{\Gamma \vdash E[v\backslash T] : \tau} \] \end{frame} % \begin{frame} \frametitle{Typage et $\beta$-réduction} On rappelle que la « $\beta$-réduction » désigne le remplacement en sous-expression d'un « redex » $(\lambda (v:\sigma). E)T$ par son « réduit » $E[v\backslash T]$. \medskip On note $X \rightarrow_\beta X'$ pour une $\beta$-réduction, et $X \twoheadrightarrow_\beta X'$ pour une suite de $\beta$-réductions. \bigskip \itempoint D'après le lemme de substitution, si $\Gamma \vdash (\lambda (v:\sigma). E)T : \tau$ alors on a aussi $\Gamma \vdash E[v\backslash T] : \tau$. \bigskip \itempoint Toujours d'après ce lemme, si $X \twoheadrightarrow_\beta X'$ et $\Gamma \vdash X:\tau$ alors $\Gamma \vdash X':\tau$. \bigskip \textcolor{blue}{\textbf{Moralité :}} le typage est compatible avec l'évaluation du $\lambda$-calcul (un terme bien typé reste bien typé quand on effectue la $\beta$-réduction et le type ne change pas). \end{frame} % \begin{frame} \frametitle{Normalisation forte} \itempoint\textbf{Théorème} (Turing, Tait, Girard) : le $\lambda$-calcul simplement typé est \textbf{fortement normalisant}, c'est-à-dire que toute suite de $\beta$-réductions sur un terme (bien typé !) termine. \bigskip {\footnotesize \textcolor{blue}{Idée cruciale de la preuve :} une induction directe échoue ($P,Q$ fortement normalisables $\not\Rightarrow$ $PQ$ fortement normalisable). À la place, on introduit une notion \emph{plus forte} permettant l'induction : \smallskip \itempoint\textbf{Définition} technique : un terme $P$ de type $\rho$ est dit « fortement calculable » lorsque : \begin{itemize} \item si $\rho = \alpha$ est une variable de type (type « atomique ») : $P$ est fortement normalisable, \item si $\rho = (\sigma\to\tau)$ est un type fonction : pour \alert{tout} $Q$ de type $\sigma$ fortement calculable, $PQ$ est fortement calculable. \end{itemize} \smallskip On prouve alors successivement : \begin{itemize} \item tout terme fortement calculable est fortement normalisable (induction facile sur le type), \item si $x_1:\sigma_1,\ldots,x_k:\sigma_k \vdash E:\tau$ et si $v_1,\ldots,v_k$ sont de types $\sigma_1,\ldots,\sigma_k$, fortement calculables et n'impliquant pas $x_1,\ldots,x_k$, alors la substitution de $v_i$ pour $x_i$ dans $E$ est fortement calculable (preuve par induction sur la dérivation du jugement, i.e., induction sur $E$ : le cas délicat est l'abstraction). \end{itemize} \par} \end{frame} % \end{document}