%% This is a LaTeX document. Hey, Emacs, -*- latex -*- , get it? \documentclass[mathserif,a4paper,aspectratio=169]{beamer} %\documentclass[a4paper]{article} %\usepackage[envcountsect,noxcolor]{beamerarticle} \usepackage[shorthands=off,french]{babel} \usepackage[utf8]{inputenc} \usepackage[T1]{fontenc} \usepackage{lmodern} \DeclareUnicodeCharacter{00A0}{~} \DeclareUnicodeCharacter{2026}{...} \DeclareUnicodeCharacter{1E25}{\d{h}} % Beamer theme: \usetheme{Goettingen} %\usecolortheme{albatross} %\usecolortheme{lily} %\setbeamercovered{transparent} % A tribute to the worthy AMS: \usepackage{amsmath} \usepackage{amsfonts} \usepackage{amssymb} \usepackage{amsthm} % \usepackage{mathrsfs} % \usepackage{graphicx} \usepackage{tikz} \usetikzlibrary{arrows,automata,calc} % \newcommand{\itempoint}{\strut\hbox{\color{beamerstructure}\donotcoloroutermaths$\blacktriangleright$}\nobreak\hskip.5em plus.5em\relax} \renewcommand{\thefootnote}{\textdagger} \newcommand{\dbllangle}{\mathopen{\langle\!\langle}} \newcommand{\dblrangle}{\mathclose{\rangle\!\rangle}} % % % \title{Typage simple} \subtitle{INF110 (Logique et Fondements de l'Informatique)} \author[David Madore]{David A. Madore\\ {\footnotesize Télécom Paris}\\ \texttt{david.madore@enst.fr}} \date{2023–2024} \mode{% \beamertemplatenavigationsymbolsempty \usenavigationsymbolstemplate{\vbox{\hbox{\footnotesize\hyperlinkslideprev{$\leftarrow$}\insertframenumber/\inserttotalframenumber\hyperlinkslidenext{$\rightarrow$}}}} } \setbeamercolor{myhighlight}{fg=black,bg=white!90!green} \begin{document} \mode
{\maketitle} % \setlength\abovedisplayskip{2pt plus 2pt minus 2pt} \setlength\belowdisplayskip{2pt plus 2pt minus 2pt} % \begin{frame} \titlepage {\footnotesize\center{\url{http://perso.enst.fr/madore/inf110/transp-inf110.pdf}}\par} {\tiny \immediate\write18{sh ./vc > vcline.tex} \begin{center} Git: \input{vcline.tex} \end{center} \immediate\write18{echo ' (stale)' >> vcline.tex} \par} \end{frame} % \section*{Plan} \begin{frame} \frametitle{Plan} \tableofcontents \end{frame} % \section{Généralités sur le typage} \begin{frame} \frametitle{Qu'est-ce que le typage ?} {\footnotesize Philosophie opposée du « codage de Gödel » en calculabilité, lequel représente toute donnée finie par un entier.\par} \medskip \itempoint Informellement, un \textbf{système de typage} est une façon d'affecter à toute \alert{expression} et/ou \alert{valeur} manipulée par un langage informatique un \textbf{type} qui contraint son usage {\footnotesize (p.ex., « entier », « fonction », « chaîne de caractères »)}. \medskip \textbf{Buts :} \begin{itemize} \item attraper plus tôt des \textbf{erreurs de programmation} {\footnotesize (« ajouter un entier et une chaîne de caractères » est probablement une erreur, ou demande une conversion explicite)}, \item éviter des \textbf{plantages ou problèmes de sécurité} {\footnotesize (exécution d'un entier)}, \item garantir certaines \textbf{propriétés du comportement} des programmes ($\rightarrow$ analyse statique), forcément de façon limitée (cf. théorème de Rice), p.ex., la \alert{terminaison}, \item aider à l'\textbf{optimisation} {\footnotesize (fonction pure : sans effet de bord)}. \end{itemize} \medskip {\footnotesize Cf. systèmes d'unités (homogénéité) en physique.\par} \end{frame} % \begin{frame} \frametitle{Variétés de typage} Il y a autant de systèmes de typage que de langages de programmation ! \medskip \itempoint Typage \textbf{statique} (à compilation) vs \textbf{dynamique} (à exécution) ou mixte. {\footnotesize En général on préfère : erreur à la compilation $>$ erreur à l'exécution $>$ plantage.\par} \medskip \itempoint Typage \textbf{inféré} par le langage ou \textbf{annoté} par le programmeur. {\footnotesize Type = promesse donnée par le langage au programmeur ou par le programmeur au langage ?\par} \medskip \itempoint Typage « sûr » ou partiel/contournable (\textit{cast} de la valeur, manipulation de la représentation mémoire, suppression ou report à l'exécution de vérification). \medskip \itempoint Typage superficiel {\footnotesize (« ceci est une liste »)} ou complexe {\footnotesize (« ceci est une liste d'entiers »)}. \medskip \itempoint Diverses annotations possibles {\footnotesize (« cette fonction est pure », « soulève une exception »)}. \medskip \itempoint Liens avec les mécanismes de sécurité (qui peut faire quoi ?), de gestion de la mémoire (système de typage linéaire), l'évaluation (exceptions), la mutabilité. \medskip \itempoint Les types sont-ils citoyens de première classe {\footnotesize (:= manipulables dans le langage)} ? {\footnotesize Juvénal : « Quis custodiet ipsos custodes? » Quel est le type des types eux-mêmes ?\par} \end{frame} % \begin{frame} \frametitle{Opérations de base sur les types} En plus de types de base (p.ex. $\texttt{Nat}$ = entiers, $\texttt{Bool}$ = booléens), les opérations suivantes sur les types sont \emph{souvent} proposées par les systèmes de typage : \bigskip \itempoint Types \textbf{produits} (= paires, triplets, $k$-uplets). P.ex. $\texttt{Nat} \times \texttt{Bool}$ = type des paires formées d'un entier et d'un booléen. \smallskip Composantes éventuellement nommées $\rightarrow$ structures (= enregistrements). \smallskip Produit vide = type trivial, $\texttt{Unit}$ (une seule valeur). \bigskip \itempoint Types \textbf{sommes} (= unions). P.ex. $\texttt{Nat} + \texttt{Bool}$ = type pouvant contenir un entier \emph{ou} un booléen, avec un \alert{sélecteur} de cas. \smallskip Cas particulier : $\texttt{Unit} + \cdots + \texttt{Unit}$ = type « énumération » (pur sélecteur). \smallskip Somme vide = type inhabité (impossible : aucune valeur). \bigskip \itempoint Types \textbf{fonctions} (= exponentielles). P.ex. $\texttt{Nat} \rightarrow \texttt{Bool}$. \bigskip \itempoint Types \textbf{listes}. P.ex. $\texttt{List}~\texttt{Nat}$ = type des listes d'entiers. \end{frame} % \begin{frame} \frametitle{Quelques fonctionnalités fréquentes} \itempoint \textbf{Sous-typage} = les valeurs d'un type sont automatiquement des valeurs possibles d'un autre. \bigskip \itempoint \textbf{Polymorphisme} = utilisation de plusieurs types possibles, voire de n'importe quel type (cf. transp. suivant). P.ex. la fonction « identité » $(\forall\mathtt{t})\; \mathtt{t} \rightarrow \mathtt{t}$. \bigskip \itempoint \textbf{Constructeurs de types} = fabriquent un type à partir d'un (ou plusieurs) autres. P.ex. $\texttt{List}$ (fabrique le type « liste de $\mathtt{t}$ » à partir de $\mathtt{t}$). \bigskip \itempoint \textbf{Types récursifs} = construits par les opérateurs (produits, sommes, fonctions, constructeurs…) à partir des types définis eux-mêmes. P.ex. $\texttt{Tree} = \texttt{List}~\texttt{Tree}$. \bigskip \itempoint \textbf{Types dépendants} = un type à partir d'une valeur. P.ex. $k \mapsto \texttt{Nat}^k$. \bigskip \itempoint \textbf{Types opaques} (abstraits, privés…) = types dont les valeurs sont cachées, l'usage est limité à une interface publique. \end{frame} % \begin{frame} \frametitle{Polymorphisme} On distingue deux (trois ?) sortes de polymorphismes : \medskip \itempoint Polymorphisme \textbf{paramétrique} (ou « génériques ») : la même fonction \alert{s'applique à l'identique} à une donnée de n'importe quel type. \smallskip Exemples : \begin{itemize} \item $\texttt{head} : (\forall\mathtt{t})\; \texttt{List}~\mathtt{t} \to \mathtt{t}$ (renvoie le premier élément d'une liste) \item $\lambda xy.\langle x,y\rangle : (\forall\mathtt{u},\mathtt{v})\; \mathtt{u} \to \mathtt{v} \to \mathtt{u}\times \mathtt{v}$ (fabrique un couple) \item $\lambda xyz.xz(yz) : (\forall\mathtt{u},\mathtt{v},\mathtt{w})\; (\mathtt{u} \to \mathtt{v} \to \mathtt{w}) \to (\mathtt{u} \to \mathtt{v}) \to \mathtt{u} \to \mathtt{w}$ \end{itemize} \smallskip Pas seulement pour les fonctions ! $\texttt{[]} : (\forall\mathtt{t})\; \texttt{List}~\mathtt{t}$ (liste vide) \smallskip {\footnotesize Et même : $\texttt{while~true~do~pass~done} : (\forall\mathtt{t})\; \mathtt{t}$ (boule infinie)\par} \bigskip \itempoint Polymorphisme \textbf{ad hoc} (ou « surcharge » / « \textit{overloading} ») : la fonction \alert{agit différemment} en fonction du type de son argument (connu à la compilation !). \bigskip {\footnotesize Le sous-typage est parfois considéré comme une forme de polymorphisme, voire la coercion (\textit{cast}). Les limites de ces notions sont floues.\par} \end{frame} % \begin{frame} \frametitle{Tâches d'un système de typage} \itempoint \textbf{Vérification} de type : vérifier qu'une expression \emph{annotée} a bien le type prétendu par les annotations. \bigskip \itempoint \textbf{Inférence} (« reconstruction » / « assignation ») de type : calculer le type de l'expression \alert{en l'absence d'annotations} (ou avec annotations partielles). \medskip Algorithme important : \textbf{Hindley-Milner} (inférence de type dans les langages fonctionnels à polymorphisme paramétrique). Utilisé dans OCaml, Haskell, etc. \medskip \textbf{N.B.} Dans un système de typage trop complexe, l'inférence (voire la vérification !) \textcolor{orange}{peut devenir indécidable} (notamment si types de première classe / dépendant de valeurs arbitraires à l'exécution). \bigskip {\footnotesize Rarement utile en informatique mais essentiel en logique ($\cong$ recherche de preuves) :\par} \itempoint \textbf{Habitation} de type : trouver un \alert{terme} (=expression) ayant un type donné. {\footnotesize P.ex. : y a-t-il un terme de type $(\forall\mathtt{p},\mathtt{q})\; ((\mathtt{p} \to \mathtt{q}) \to \mathtt{p}) \to \mathtt{p}$ ?\par} {\footnotesize \textbf{N.B.} Dans les langages usuels, \alert{tous} les types sont habités par une boucle infinie (« \texttt{while true do pass done} » ou « \texttt{let rec f () = f () in f ()} »), \alert{même} le type vide.\par} \end{frame} % \begin{frame} \frametitle{Utilisations du typage au-delà des valeurs stockées} \itempoint Annotation des \textbf{exceptions soulevables} (fréquent, p.ex. Java). \bigskip \itempoint Annotation de la \textbf{mutabilité} par le type. P.ex. $\texttt{Nat}$ = type d'un entier (immuable) mais $\texttt{Ref~Nat}$ = type d'une \alert{référence} vers un entier (mutable). \bigskip \itempoint Annotation des \textbf{effets de bord} par le type. P.ex., en Haskell, $\texttt{Char}$ = caractère = fonction de zéro argument renvoyant un caractère (fonction pure : toujours le même retour), mais $\texttt{IO~Char}$ = \alert{action} avec effets de bord renvoyant un caractère ($\texttt{IO}$ est un constructeur de type appelé « monade » I/O). \bigskip \itempoint Typage \textbf{linéaire} (forme de typage « sous-structurel ») ou types à unicité : assure qu'une valeur est utilisée \alert{une et une seule fois} dans un calcul (ni duplication ni perte sauf manœuvre spéciale). \smallskip Permet d'optimiser la gestion de la mémoire (Rust) et/ou d'annoter les effets de bord (Clean). \end{frame} % \begin{frame} \frametitle{Quelques exemples (1)} Les langages impératifs \emph{tendent} à avoir des systèmes de typage moins complexes que les langages fonctionnels. \medskip {\footnotesize Éviter les termes de typage « faible » et « fort », qui veulent tout (ou rien) dire.\par} \medskip \itempoint Assembleur (langage machine) : aucun typage (tout est donnée binaire). {\footnotesize Idem : machine de Turing, fonctions générales récursives (tout est entier), $\lambda$-calcul non typé (tout est fonction).\par} \medskip \itempoint C : annoté, vérifié à la compilation (\emph{aucune} vérification à l'exécution), moyennement complexe et contournable (pointeurs génériques \texttt{void*}). \medskip \itempoint Python, JavaScript, Perl, Scheme, etc. : typage vérifié à l'exécution, superficiel. Suffisant pour éviter les comportements indéfinis. \medskip \itempoint Java : annoté, mixte compilation/exécution (double vérification), initialement superficiel (listes non typées), puis introduction de « génériques » ($\rightarrow$ polymorphisme paramétrique) avec Java 5, puis diverses sortes d'inférence. \medskip \itempoint Rust : interaction avec la gestion de la mémoire ($\approx$ typage linéaire). \end{frame} % \begin{frame} \frametitle{Quelques exemples (2)} {\footnotesize Qqs exemples de langages, généralement fonctionnels, ayant un système de typage (très) complexe, mélangeant plusieurs fonctionnalités évoquées (interactions parfois délicates !) :\par} \medskip \itempoint OCaml : inférence de type à la H-M, types récursifs, polymor\textsuperscript{sme} paramétrique. \smallskip Système de « modules » (« signatures » $\approx$ interfaces abstraites, « foncteurs » entre signatures…), comparable aux « classes » des langages orientés objet. \medskip \itempoint Haskell : beaucoup de similarité avec OCaml : \smallskip + polymorphisme ad hoc : « classes de type », comparable aux « modules » de OCaml, aux « classes » des langages orientés objet. \smallskip + purement fonctionnel (toutes les fonctions sont « pures ») : les effets de bord sont enrobés dans des « monades ». \medskip \itempoint Mercury (langage de type fonctionnel+logique, inspiré de Haskell+Prolog) : typage comparable à Haskell ; + sous-typage, linéarité. \medskip \itempoint Idris : langage fonctionnel + assistant de preuve. \end{frame} % \begin{frame} \label{typing-and-termination} \frametitle{Typage et terminaison} Un système de typage \alert{peut} garantir que \textbf{tout programme bien typé termine}. \bigskip Ce \alert{n'est pas le cas} pour les langages de programmation usuels (en OCaml, Haskell, etc., un programme bien typé peut faire une boucle infinie). \bigskip Si on veut que le système de typage soit décidable, ceci met forcément des \alert{limites sur l'expressivité} du langage ($\leftarrow$ indécidabilité du problème de l'arrêt). \bigskip Notamment, le langage ne permettra pas d'écrire son propre interpréteur (même argument « diagonal » que pour les fonctions p.r. par thm. de réc\textsuperscript{sion} de Kleene). \bigskip Notamment aussi : pas de boucle illimitée, pas d'appels récursifs \emph{non contraints}, pas de type tel que $\mathtt{t} \,\cong\, (\mathtt{t}\rightarrow \mathtt{t})$. Aucun terme de type vide ! \bigskip Néanmoins, le langage peut être \alert{beaucoup plus puissant} que les fonctions p.r. \bigskip Exemple de tel langage : Coq. \end{frame} % \begin{frame} \frametitle{La correspondance de Curry-Howard (avant-goût)} Idée générale : établir une analogie, voire une correspondance précise entre \begin{itemize} \item \textbf{types} et \textbf{termes} de ces types dans un système de typage, \item \textbf{propositions} et \textbf{preuves} de ces propositions dans un système logique. \end{itemize} \smallskip P.ex., la preuve évidente de l'affirmation $(A \land B) \Rightarrow A$ (« si $A$ et $B$ sont vraies alors $A$ est vraie ») correspond à la « première projection » de type $a \times b \rightarrow a$. \smallskip {\footnotesize Ceci « explique » que le type d'un terme tel que $\lambda xy.x$, soit $u \to v \to u$, soit une vérité logique, en l'occurrence $U \Rightarrow V \Rightarrow U$ (« si $U$ est vrai alors, si $V$ est vrai alors $U$ est vrai »).\par} \bigskip Beaucoup de variations sur cette correspondance, mais il y a des restrictions : \begin{itemize} \item le langage informatique doit garantir la terminaison, sinon cela reviendrait à permettre les preuves circulaires, \item la logique concernée est plutôt « intuitionniste » (sans tiers exclu), \item diverses subtilités notamment dans la correspondance entre types sommes paramétriques (types $\Sigma$) et $\exists$ côté logique. \end{itemize} \end{frame} % \begin{frame} \frametitle{Paradoxe de Curry (interlude distrayant)} {\footnotesize Variante plus sophistiquée de « cette phrase est fausse ». C'est un exemple de preuve circulaire ($\leftrightarrow$ combinateur $\mathsf{Y}$ de Curry par la correspondance de C-H), invalide en logique.\par} \medskip Je tiens l'affirmation : « \textcolor{teal}{si j'ai raison, alors je suis un grand génie} ». \begin{itemize} \item clairement, si j'ai raison, je suis un grand génie ; \item mais c'était justement mon affirmation : donc j'ai raison ; \item donc je suis un grand génie. \qedsymbol \end{itemize} {\footnotesize Remplacer « j'ai raison » par « cette phrase est vraie » (voire utiliser l'astuce de Quine pour éviter « cette phrase ») et « je suis un grand génie » par absolument n'importe quoi.\par} \bigskip \itempoint Ce qui est correct : \alert{si on peut construire} un énoncé $A$ tel que $A \Leftrightarrow (A \Rightarrow B)$ (ici $A$ est l'affirmation tenue et $B$ est la conclusion voulue) alors $B$ vaut : \[ (A \Leftrightarrow (A \Rightarrow B)) \, \Rightarrow \, B \] {\footnotesize (Preuve correcte : supposons $A$ : par hypothèse, ceci signifie $A \Rightarrow B$ ; on a donc $B$ ; tout ceci prouve $A \Rightarrow B$. Bref on a $A \Rightarrow B$. Mais par hypothèse c'est $A$. Donc $A$ vaut. Donc $B$ aussi.)\par} \medskip \itempoint Ce qui est \textcolor{orange}{fallacieux} : la supposition tacite qu'on peut construire un tel $A$. {\footnotesize L'astuce de Quine permet de faire une auto-référence sur la syntaxe, pas sur la vérité.\par} \end{frame} % \begin{frame} \frametitle{Théories des types pour la logique (très bref aperçu)} \itempoint Langages spécialisés pour servir à la fois à l'écriture de programmes informatiques et de preuves mathématiques ; ils peuvent être soit sous forme de systèmes abstraits, soit sous forme d'implémentation informatique (« assistants de preuve » : Coq, Agda, Lean…). \bigskip \itempoint Dans tous les cas il s'agit de langages assurant la terminaison des programmes (cf. transp. \ref{typing-and-termination}), ou, dans le contexte du $\lambda$-calcul, la \emph{normalisation forte}. Le type vide doit être inhabité ! \bigskip Principales grandes familles (chacune avec énormément de variantes) : \begin{itemize} \item théories des types à la Martin-Löf (« MLTT ») : suit jusqu'au bout la correspondance de Curry-Howard (\emph{aucune} distinction entre types et propositions ; {\footnotesize pas de $\exists$ mais plutôt un $\Sigma$}), $\rightarrow$ Agda ; \item variantes du « calcul des constructions » (« CoC »), $\rightarrow$ Coq ; \item théorie homotopique des types (« HoTT ») : « égalité = isomorphisme ». \end{itemize} \end{frame} % \begin{frame} \frametitle{Le $\lambda$-cube de Barendregt (très bref aperçu)} Il s'agit d'un ensemble de $8 = 2^3$ théories des types pour la logique : la plus faible est le « $\lambda$-calcul simplement typé » ($\lambda_\rightarrow$, décrit plus loin), la plus forte le « calcul des constructions » (« CoC »). \medskip Chaque théorie du cube est caractérisée par l'absence ou la présence de chacune des $3$ fonctionnalités suivantes ($\lambda_\rightarrow$ n'a aucune des trois, CoC a les trois) : \begin{itemize} \item \textcolor{blue}{termes pouvant dépendre de types}, ou polymorphisme paramétrique « explicitement quantifié » (p.ex. $\prod t.\; (t \rightarrow t)$) ; \item \textcolor{blue}{types pouvant dépendre de types}, ou constructeurs de types ; \item \textcolor{blue}{types pouvant dépendre de termes}, ou « types dépendants », correspondant côté logique à la quantification sur les individus. \end{itemize} \medskip {\footnotesize On peut ensuite encore ajouter des fonctionnalités : par exemple, Coq est basé sur le « calcul des constructions inductives » qui ajoute au calcul des constructions des mécanismes systématiques pour former des types (positivement !) récursifs.\par} \end{frame} % \end{document}