%% This is a LaTeX document. Hey, Emacs, -*- latex -*- , get it? \documentclass[mathserif,a4paper,aspectratio=169]{beamer} %\documentclass[a4paper]{article} %\usepackage[envcountsect,noxcolor]{beamerarticle} \usepackage[shorthands=off,french]{babel} \usepackage[utf8]{inputenc} \usepackage[T1]{fontenc} \usepackage{lmodern} \DeclareUnicodeCharacter{00A0}{~} \DeclareUnicodeCharacter{2026}{...} \DeclareUnicodeCharacter{1E25}{\d{h}} % Beamer theme: \usetheme{Goettingen} %\usecolortheme{albatross} %\usecolortheme{lily} %\setbeamercovered{transparent} % A tribute to the worthy AMS: \usepackage{amsmath} \usepackage{amsfonts} \usepackage{amssymb} \usepackage{amsthm} % \usepackage{mathrsfs} % \usepackage{graphicx} \usepackage{tikz} \usetikzlibrary{arrows,automata,calc} % \newcommand{\itempoint}{\strut\hbox{\color{beamerstructure}\donotcoloroutermaths$\blacktriangleright$}\nobreak\hskip.5em plus.5em\relax} \renewcommand{\thefootnote}{\textdagger} \newcommand{\dbllangle}{\mathopen{\langle\!\langle}} \newcommand{\dblrangle}{\mathclose{\rangle\!\rangle}} % % % \title{Typage simple} \subtitle{INF110 (Logique et Fondements de l'Informatique)} \author[David Madore]{David A. Madore\\ {\footnotesize Télécom Paris}\\ \texttt{david.madore@enst.fr}} \date{2023–2024} \mode{% \beamertemplatenavigationsymbolsempty \usenavigationsymbolstemplate{\vbox{\hbox{\footnotesize\hyperlinkslideprev{$\leftarrow$}\insertframenumber/\inserttotalframenumber\hyperlinkslidenext{$\rightarrow$}}}} } \setbeamercolor{myhighlight}{fg=black,bg=white!90!green} \begin{document} \mode
{\maketitle} % \setlength\abovedisplayskip{2pt plus 2pt minus 2pt} \setlength\belowdisplayskip{2pt plus 2pt minus 2pt} % \begin{frame} \titlepage {\footnotesize\center{\url{http://perso.enst.fr/madore/inf110/transp-inf110.pdf}}\par} {\tiny \immediate\write18{sh ./vc > vcline.tex} \begin{center} Git: \input{vcline.tex} \end{center} \immediate\write18{echo ' (stale)' >> vcline.tex} \par} \end{frame} % \section*{Plan} \begin{frame} \frametitle{Plan} \tableofcontents \end{frame} % \section{Généralités sur le typage} \begin{frame} \frametitle{Qu'est-ce que le typage ?} {\footnotesize Philosophie opposée du « codage de Gödel » en calculabilité, lequel représente toute donnée finie par un entier.\par} \medskip \itempoint Informellement, un \textbf{système de typage} est une façon d'affecter à toute \alert{expression} et/ou \alert{valeur} manipulée par un langage informatique un \textbf{type} qui contraint son usage {\footnotesize (p.ex., « entier », « fonction », « chaîne de caractères »)}. \medskip \textbf{Buts :} \begin{itemize} \item attraper plus tôt des \textbf{erreurs de programmation} {\footnotesize (« ajouter un entier et une chaîne de caractères » est probablement une erreur, ou demande une conversion explicite)}, \item éviter des \textbf{plantages ou problèmes de sécurité} {\footnotesize (exécution d'un entier)}, \item garantir certaines \textbf{propriétés du comportement} des programmes ($\rightarrow$ analyse statique), forcément de façon limitée (cf. théorème de Rice), p.ex., la \alert{terminaison}, \item aider à l'\textbf{optimisation} {\footnotesize (fonction pure : sans effet de bord)}. \end{itemize} \medskip {\footnotesize Cf. systèmes d'unités (homogénéité) en physique.\par} \end{frame} % \begin{frame} \frametitle{Variétés de typage} Il y a autant de systèmes de typage que de langages de programmation ! \medskip \itempoint Typage \textbf{statique} (à compilation) vs \textbf{dynamique} (à exécution) ou mixte. {\footnotesize En général on préfère : erreur à la compilation $>$ erreur à l'exécution $>$ plantage.\par} \medskip \itempoint Typage \textbf{inféré} par le langage ou \textbf{annoté} par le programmeur. {\footnotesize Type = promesse donnée par le langage au programmeur ou par le programmeur au langage ?\par} \medskip \itempoint Typage « sûr » ou partiel/contournable (\textit{cast} de la valeur, manipulation de la représentation mémoire, suppression ou report à l'exécution de vérification). \medskip \itempoint Typage superficiel {\footnotesize (« ceci est une liste »)} ou complexe {\footnotesize (« ceci est une liste d'entiers »)}. \medskip \itempoint Diverses annotations possibles {\footnotesize (« cette fonction est pure », « soulève une exception »)}. \medskip \itempoint Liens avec les mécanismes de sécurité (qui peut faire quoi ?), de gestion de la mémoire (système de typage linéaire), l'évaluation (exceptions), la mutabilité. \medskip \itempoint Les types sont-ils citoyens de première classe {\footnotesize (:= manipulables dans le langage)} ? {\footnotesize Juvénal : « Quis custodiet ipsos custodes? » Quel est le type des types eux-mêmes ?\par} \end{frame} % \begin{frame} \frametitle{Opérations de base sur les types} En plus de types de base (p.ex. $\texttt{Nat}$ = entiers, $\texttt{Bool}$ = booléens), les opérations suivantes sur les types sont \emph{souvent} proposées par les systèmes de typage : \bigskip \itempoint Types \textbf{produits} (= paires, triplets, $k$-uplets). P.ex. $\texttt{Nat} \times \texttt{Bool}$ = type des paires formées d'un entier et d'un booléen. \smallskip Composantes éventuellement nommées $\rightarrow$ structures (= enregistrements). \smallskip Produit vide = type trivial, $\texttt{Unit}$ (une seule valeur). \bigskip \itempoint Types \textbf{sommes} (= unions). P.ex. $\texttt{Nat} + \texttt{Bool}$ = type pouvant contenir un entier \emph{ou} un booléen, avec un \alert{sélecteur} de cas. \smallskip Cas particulier : $\texttt{Unit} + \cdots + \texttt{Unit}$ = type « énumération » (pur sélecteur). \smallskip Somme vide = type inhabité (impossible : aucune valeur). \bigskip \itempoint Types \textbf{fonctions} (= exponentielles). P.ex. $\texttt{Nat} \rightarrow \texttt{Bool}$. \bigskip \itempoint Types \textbf{listes}. P.ex. $\texttt{List}~\texttt{Nat}$ = type des listes d'entiers. \end{frame} % \begin{frame} \frametitle{Quelques fonctionnalités fréquentes} \itempoint \textbf{Sous-typage} = les valeurs d'un type sont automatiquement des valeurs possibles d'un autre. \bigskip \itempoint \textbf{Polymorphisme} = utilisation de plusieurs types possibles, voire de n'importe quel type (cf. transp. suivant). P.ex. la fonction « identité » $(\forall\mathtt{t})\; \mathtt{t} \rightarrow \mathtt{t}$. \bigskip \itempoint \textbf{Constructeurs de types} = fabriquent un type à partir d'un (ou plusieurs) autres. P.ex. $\texttt{List}$ (fabrique le type « liste de $\mathtt{t}$ » à partir de $\mathtt{t}$). \bigskip \itempoint \textbf{Types récursifs} = construits par les opérateurs (produits, sommes, fonctions, constructeurs…) à partir des types définis eux-mêmes. P.ex. $\texttt{Tree} = \texttt{List}~\texttt{Tree}$. \bigskip \itempoint \textbf{Types dépendants} = un type à partir d'une valeur. P.ex. $k \mapsto \texttt{Nat}^k$. \bigskip \itempoint \textbf{Types opaques} (abstraits, privés…) = types dont les valeurs sont cachées, l'usage est limité à une interface publique. \end{frame} % \begin{frame} \frametitle{Polymorphisme} On distingue deux (trois ?) sortes de polymorphismes : \medskip \itempoint Polymorphisme \textbf{paramétrique} (ou « génériques ») : la même fonction \alert{s'applique à l'identique} à une donnée de n'importe quel type. \smallskip Exemples : \begin{itemize} \item $\texttt{head} : (\forall\mathtt{t})\; \texttt{List}~\mathtt{t} \to \mathtt{t}$ (renvoie le premier élément d'une liste) \item $\lambda xy.\langle x,y\rangle : (\forall\mathtt{u},\mathtt{v})\; \mathtt{u} \to \mathtt{v} \to \mathtt{u}\times \mathtt{v}$ (fabrique un couple) \item $\lambda xyz.xz(yz) : (\forall\mathtt{u},\mathtt{v},\mathtt{w})\; (\mathtt{u} \to \mathtt{v} \to \mathtt{w}) \to (\mathtt{u} \to \mathtt{v}) \to \mathtt{u} \to \mathtt{w}$ \end{itemize} \smallskip Pas seulement pour les fonctions ! $\texttt{[]} : (\forall\mathtt{t})\; \texttt{List}~\mathtt{t}$ (liste vide) \smallskip {\footnotesize Et même : $\texttt{while~true~do~pass~done} : (\forall\mathtt{t})\; \mathtt{t}$ (boule infinie)\par} \bigskip \itempoint Polymorphisme \textbf{ad hoc} (ou « surcharge » / « \textit{overloading} ») : la fonction \alert{agit différemment} en fonction du type de son argument (connu à la compilation !). \bigskip {\footnotesize Le sous-typage est parfois considéré comme une forme de polymorphisme, voire la coercion (\textit{cast}). Les limites de ces notions sont floues.\par} \end{frame} % \begin{frame} \frametitle{Tâches d'un système de typage} \itempoint \textbf{Vérification} de type : vérifier qu'une expression \emph{annotée} a bien le type prétendu par les annotations. \bigskip \itempoint \textbf{Inférence} (« reconstruction » / « assignation ») de type : calculer le type de l'expression \alert{en l'absence d'annotations} (ou avec annotations partielles). \medskip Algorithme important : \textbf{Hindley-Milner} (inférence de type dans les langages fonctionnels à polymorphisme paramétrique). Utilisé dans OCaml, Haskell, etc. \medskip \textbf{N.B.} Dans un système de typage trop complexe, l'inférence (voire la vérification !) \textcolor{orange}{peut devenir indécidable} (notamment si types de première classe / dépendant de valeurs arbitraires à l'exécution). \bigskip {\footnotesize Rarement utile en informatique mais essentiel en logique ($\cong$ recherche de preuves) :\par} \itempoint \textbf{Habitation} de type : trouver un \alert{terme} (=expression) ayant un type donné. {\footnotesize P.ex. : y a-t-il un terme de type $(\forall\mathtt{p},\mathtt{q})\; ((\mathtt{p} \to \mathtt{q}) \to \mathtt{p}) \to \mathtt{p}$ ?\par} {\footnotesize \textbf{N.B.} Dans les langages usuels, \alert{tous} les types sont habités par une boucle infinie (« \texttt{while true do pass done} » ou « \texttt{let rec f () = f () in f ()} »), \alert{même} le type vide.\par} \end{frame} % \begin{frame} \frametitle{Utilisations du typage au-delà des valeurs stockées} \itempoint Annotation des \textbf{exceptions soulevables} (fréquent, p.ex. Java). \bigskip \itempoint Annotation de la \textbf{mutabilité} par le type. P.ex. $\texttt{Nat}$ = type d'un entier (immuable) mais $\texttt{Ref~Nat}$ = type d'une \alert{référence} vers un entier (mutable). \bigskip \itempoint Annotation des \textbf{effets de bord} par le type. P.ex., en Haskell, $\texttt{Char}$ = caractère = fonction de zéro argument renvoyant un caractère (fonction pure : toujours le même retour), mais $\texttt{IO~Char}$ = \alert{action} avec effets de bord renvoyant un caractère ($\texttt{IO}$ est un constructeur de type appelé « monade » I/O). \bigskip \itempoint Typage \textbf{linéaire} (forme de typage « sous-structurel ») ou types à unicité : assure qu'une valeur est utilisée \alert{une et une seule fois} dans un calcul (ni duplication ni perte sauf manœuvre spéciale). \smallskip Permet d'optimiser la gestion de la mémoire (Rust) et/ou d'annoter les effets de bord (Clean). \end{frame} % \begin{frame} \frametitle{Quelques exemples (1)} Les langages impératifs \emph{tendent} à avoir des systèmes de typage moins complexes que les langages fonctionnels. \medskip {\footnotesize Éviter les termes de typage « faible » et « fort », qui veulent tout (ou rien) dire.\par} \medskip \itempoint Assembleur (langage machine) : aucun typage (tout est donnée binaire). {\footnotesize Idem : machine de Turing, fonctions générales récursives (tout est entier), $\lambda$-calcul non typé (tout est fonction).\par} \medskip \itempoint C : annoté, vérifié à la compilation (\emph{aucune} vérification à l'exécution), moyennement complexe et contournable (pointeurs génériques \texttt{void*}). \medskip \itempoint Python, JavaScript, Perl, Scheme, etc. : typage vérifié à l'exécution, superficiel. Suffisant pour éviter les comportements indéfinis. \medskip \itempoint Java : annoté, mixte compilation/exécution (double vérification), initialement superficiel (listes non typées), puis introduction de « génériques » ($\rightarrow$ polymorphisme paramétrique) avec Java 5, puis diverses sortes d'inférence. \medskip \itempoint Rust : interaction avec la gestion de la mémoire ($\approx$ typage linéaire). \end{frame} % \begin{frame} \frametitle{Quelques exemples (2)} {\footnotesize Qqs exemples de langages, généralement fonctionnels, ayant un système de typage (très) complexe, mélangeant plusieurs fonctionnalités évoquées (interactions parfois délicates !) :\par} \medskip \itempoint OCaml : inférence de type à la H-M, types récursifs, polymor\textsuperscript{sme} paramétrique. \smallskip Système de « modules » (« signatures » $\approx$ interfaces abstraites, « foncteurs » entre signatures…), comparable aux « classes » des langages orientés objet. \medskip \itempoint Haskell : beaucoup de similarité avec OCaml : \smallskip + polymorphisme ad hoc : « classes de type », comparable aux « modules » de OCaml, aux « classes » des langages orientés objet. \smallskip + purement fonctionnel (toutes les fonctions sont « pures ») : les effets de bord sont enrobés dans des « monades ». \medskip \itempoint Mercury (langage de type fonctionnel+logique, inspiré de Haskell+Prolog) : typage comparable à Haskell ; + sous-typage, linéarité. \medskip \itempoint Idris : langage fonctionnel + assistant de preuve. \end{frame} % \end{document}