%% This is a LaTeX document.  Hey, Emacs, -*- latex -*- , get it?
\documentclass[mathserif,a4paper,aspectratio=169]{beamer}
%\documentclass[a4paper]{article}
%\usepackage[envcountsect,noxcolor]{beamerarticle}
\usepackage[shorthands=off,french]{babel}
\usepackage[utf8]{inputenc}
\usepackage[T1]{fontenc}
\usepackage{lmodern}
\DeclareUnicodeCharacter{00A0}{~}
\DeclareUnicodeCharacter{2026}{...}
\DeclareUnicodeCharacter{1E25}{\d{h}}
% Beamer theme:
\usetheme{Goettingen}
%\usecolortheme{albatross}
%\usecolortheme{lily}
%\setbeamercovered{transparent}
% A tribute to the worthy AMS:
\usepackage{amsmath}
\usepackage{amsfonts}
\usepackage{amssymb}
\usepackage{amsthm}
%
\usepackage{mathrsfs}
\usepackage{mathpartir}
%
\usepackage{graphicx}
\usepackage{tikz}
\usetikzlibrary{arrows,automata,calc}
%
\newcommand{\itempoint}{\strut\hbox{\color{beamerstructure}\donotcoloroutermaths$\blacktriangleright$}\nobreak\hskip.5em plus.5em\relax}
\renewcommand{\thefootnote}{\textdagger}
\newcommand{\dbllangle}{\mathopen{\langle\!\langle}}
\newcommand{\dblrangle}{\mathclose{\rangle\!\rangle}}
%
%
%
\title{Typage simple}
\subtitle{INF110 (Logique et Fondements de l'Informatique)}
\author[David Madore]{David A. Madore\\
{\footnotesize Télécom Paris}\\
\texttt{david.madore@enst.fr}}
\date{2023–2024}
\mode<presentation>{%
\beamertemplatenavigationsymbolsempty
\usenavigationsymbolstemplate{\vbox{\hbox{\footnotesize\hyperlinkslideprev{$\leftarrow$}\insertframenumber/\inserttotalframenumber\hyperlinkslidenext{$\rightarrow$}}}}
}
\setbeamercolor{myhighlight}{fg=black,bg=white!90!green}
\begin{document}
\mode<article>{\maketitle}
%
\setlength\abovedisplayskip{2pt plus 2pt minus 2pt}
\setlength\belowdisplayskip{2pt plus 2pt minus 2pt}
%
\begin{frame}
\titlepage
{\footnotesize\center{\url{http://perso.enst.fr/madore/inf110/transp-inf110.pdf}}\par}
{\tiny
\immediate\write18{sh ./vc > vcline.tex}
\begin{center}
Git: \input{vcline.tex}
\end{center}
\immediate\write18{echo ' (stale)' >> vcline.tex}
\par}
\end{frame}
%
\section*{Plan}
\begin{frame}
\frametitle{Plan}
\tableofcontents
\end{frame}
%
\section{Généralités sur le typage}
\begin{frame}
\frametitle{Qu'est-ce que le typage ?}

{\footnotesize Philosophie opposée du « codage de Gödel » en
  calculabilité, lequel représente toute donnée finie par un
  entier.\par}

\medskip

\itempoint Informellement, un \textbf{système de typage} est une façon
d'affecter à toute \alert{expression} et/ou \alert{valeur} manipulée
par un langage informatique un \textbf{type} qui contraint son usage
{\footnotesize (p.ex., « entier », « fonction », « chaîne de
  caractères »)}.

\medskip

\textbf{Buts :}
\begin{itemize}
\item attraper plus tôt des \textbf{erreurs de programmation}
  {\footnotesize (« ajouter un entier et une chaîne de caractères »
    est probablement une erreur, ou demande une conversion
    explicite)},
\item éviter des \textbf{plantages ou problèmes de sécurité}
  {\footnotesize (exécution d'un entier)},
\item garantir certaines \textbf{propriétés du comportement} des
  programmes ($\rightarrow$ analyse statique), forcément de façon
  limitée (cf. théorème de Rice), p.ex., la \alert{terminaison},
\item aider à l'\textbf{optimisation} {\footnotesize (fonction pure :
  sans effet de bord)}.
\end{itemize}

\medskip

{\footnotesize Cf. systèmes d'unités (homogénéité) en physique.\par}

\end{frame}
%
\begin{frame}
\frametitle{Variétés de typage}

Il y a autant de systèmes de typage que de langages de programmation !

\medskip

\itempoint Typage \textbf{statique} (à compilation) vs
\textbf{dynamique} (à exécution) ou mixte.

{\footnotesize Mixte = « graduel ».  On préfère : erreur de
  compilation $>$ erreur à l'exécution $>$ plantage.\par}

\medskip

\itempoint Typage \textbf{inféré} par le langage ou \textbf{annoté}
par le programmeur.

{\footnotesize Type = promesse donnée par le langage au
  programmeur ou par le programmeur au langage ?\par}

\medskip

\itempoint Typage « sûr » ou partiel/contournable (\textit{cast} de
la valeur, manipulation de la représentation mémoire, suppression ou
report à l'exécution de vérification).

\medskip

\itempoint Typage superficiel {\footnotesize (« ceci est une liste »)}
ou complexe {\footnotesize (« ceci est une liste d'entiers »)}.

\medskip

\itempoint Diverses annotations possibles {\footnotesize (« cette
  fonction est pure », « soulève une exception »)}.

\medskip

\itempoint Liens avec les mécanismes de sécurité (qui peut faire
quoi ?), de gestion de la mémoire (système de typage linéaire),
l'évaluation (exceptions), la mutabilité.

\medskip

\itempoint Les types sont-ils citoyens de première classe
           {\footnotesize (:= manipulables dans le langage)} ?

{\footnotesize Juvénal : « Quis custodiet ipsos custodes? » Quel est
  le type des types eux-mêmes ?\par}

\end{frame}
%
\begin{frame}
\frametitle{Opérations de base sur les types}

En plus de types de base (p.ex. $\texttt{Nat}$ = entiers,
$\texttt{Bool}$ = booléens), les opérations suivantes sur les types
sont \emph{souvent} proposées par les systèmes de typage :

\bigskip

\itempoint Types \textbf{produits} (= couples, triplets, $k$-uplets).
P.ex. $\texttt{Nat} \times \texttt{Bool}$ = type des paires formées
d'un entier et d'un booléen.

\smallskip

Composantes éventuellement nommées $\rightarrow$ structures
(= enregistrements).

\smallskip

Produit vide = type trivial, $\texttt{Unit}$ (une seule valeur).

\bigskip

\itempoint Types \textbf{sommes} (= unions).  P.ex. $\texttt{Nat} +
\texttt{Bool}$ = type pouvant contenir un entier \emph{ou} un booléen,
avec un \alert{sélecteur} de cas.

\smallskip

Cas particulier : $\texttt{Unit} + \cdots + \texttt{Unit}$ = type
« énumération » (pur sélecteur).

\smallskip

Somme vide = type inhabité (impossible : aucune valeur).

\bigskip

\itempoint Types \textbf{fonctions} (= exponentielles).
P.ex. $\texttt{Nat} \rightarrow \texttt{Bool}$ (f\textsuperscript{n}
de $\texttt{Nat}$ vers $\texttt{Bool}$).

\bigskip

\itempoint Types \textbf{listes}.  P.ex. $\texttt{List}~\texttt{Nat}$
= type des listes d'entiers.

\end{frame}
%
\begin{frame}
\frametitle{Quelques fonctionnalités fréquentes}

\itempoint \textbf{Sous-typage} = les valeurs d'un type sont
automatiquement des valeurs possibles d'un autre.

\bigskip

\itempoint \textbf{Polymorphisme} = utilisation de plusieurs types
possibles, voire de n'importe quel type (cf. transp. suivant).
P.ex. la fonction « identité » $(\forall\mathtt{t})\; \mathtt{t}
\rightarrow \mathtt{t}$.

\bigskip

\itempoint \textbf{Constructeurs de types} = fabriquent un type à
partir d'un (ou plusieurs) autres.  P.ex. $\texttt{List}$ (fabrique le
type « liste de $\mathtt{t}$ » à partir de $\mathtt{t}$).

\bigskip

\itempoint \textbf{Types récursifs} = construits par les opérateurs
(produits, sommes, fonctions, constructeurs…) à partir des types
définis eux-mêmes.  P.ex. $\texttt{Tree} =
\texttt{List}~\texttt{Tree}$.

\bigskip

\itempoint \textbf{Types dépendants} = un type à partir d'une valeur.
P.ex. $k \mapsto \texttt{Nat}^k$.

\bigskip

\itempoint \textbf{Types opaques} (abstraits, privés…) = types dont
les valeurs sont cachées, l'usage est limité à une interface publique.

\end{frame}
%
\begin{frame}
\frametitle{Polymorphisme}

On distingue deux (trois ?) sortes de polymorphismes :

\medskip

\itempoint Polymorphisme \textbf{paramétrique} (ou « génériques ») :
la même fonction \alert{s'applique à l'identique} à une donnée de
n'importe quel type.

\smallskip

Exemples :
\begin{itemize}
\item $\texttt{head} : (\forall\mathtt{t})\; \texttt{List}~\mathtt{t} \to \mathtt{t}$ (renvoie le premier élément d'une liste)
\item $\lambda xy.\langle x,y\rangle :
  (\forall\mathtt{u},\mathtt{v})\; \mathtt{u} \to \mathtt{v} \to
  \mathtt{u}\times \mathtt{v}$ (fabrique un couple)
\item $\lambda xyz.xz(yz) :
  (\forall\mathtt{u},\mathtt{v},\mathtt{w})\; (\mathtt{u} \to
  \mathtt{v} \to \mathtt{w}) \to (\mathtt{u} \to
  \mathtt{v}) \to \mathtt{u} \to
  \mathtt{w}$
\end{itemize}

\smallskip

Pas seulement pour les fonctions !  $\texttt{[]} :
(\forall\mathtt{t})\; \texttt{List}~\mathtt{t}$ (liste vide)

\smallskip

{\footnotesize Et même : $\texttt{while~true~do~pass~done} :
  (\forall\mathtt{t})\; \mathtt{t}$ (boule infinie)\par}

\bigskip

\itempoint Polymorphisme \textbf{ad hoc} (ou « surcharge » /
« \textit{overloading} ») : la fonction \alert{agit différemment} en
fonction du type de son argument (connu à la compilation !).

\bigskip

{\footnotesize Le sous-typage est parfois considéré comme une forme de
  polymorphisme, voire la coercion (\textit{cast}).  Les limites de
  ces notions sont floues.\par}

\end{frame}
%
\begin{frame}
\frametitle{Tâches d'un système de typage}

\itempoint \textbf{Vérification} de type : vérifier qu'une expression
\emph{annotée} a bien le type prétendu par les annotations.

\bigskip

\itempoint \textbf{Inférence} (« reconstruction » / « assignation »)
de type : calculer le type de l'expression \alert{en l'absence
  d'annotations} (ou avec annotations partielles).

\medskip

Algorithme important : \textbf{Hindley-Milner} (inférence de type dans
les langages fonctionnels à polymorphisme paramétrique).  Utilisé
dans OCaml, Haskell, etc.

\medskip

\textbf{N.B.} Dans un système de typage trop complexe, l'inférence
(voire la vérification !) \textcolor{orange}{peut devenir indécidable}
(notamment si types de première classe / dépendant de valeurs
arbitraires à l'exécution).

\bigskip

{\footnotesize Rarement utile en informatique mais essentiel en
  logique ($\cong$ recherche de preuves) :\par}

\itempoint \textbf{Habitation} de type : trouver un \alert{terme}
(=expression) ayant un type donné.

{\footnotesize P.ex. : y a-t-il un terme de type
  $(\forall\mathtt{p},\mathtt{q})\; ((\mathtt{p} \to \mathtt{q}) \to
  \mathtt{p}) \to \mathtt{p}$ ?\par}

{\footnotesize \textbf{N.B.} Dans les langages usuels, \alert{tous}
  les types sont habités par une boucle infinie (« \texttt{while true
    do pass done} » ou « \texttt{let rec f () = f () in f ()} »),
  \alert{même} le type vide.\par}

\end{frame}
%
\begin{frame}
\frametitle{Utilisations du typage au-delà des valeurs stockées}

\itempoint Annotation des \textbf{exceptions soulevables} (fréquent,
p.ex. Java).

\bigskip

\itempoint Annotation de la \textbf{mutabilité} par le type.
P.ex. $\texttt{Nat}$ = type d'un entier (immuable) mais
$\texttt{Ref~Nat}$ = type d'une \alert{référence} vers un entier
(mutable).

\bigskip

\itempoint Annotation des \textbf{effets de bord} par le type.  P.ex.,
en Haskell, $\texttt{Char}$ = caractère = fonction de zéro argument
renvoyant un caractère (fonction pure : toujours le même retour), mais
$\texttt{IO~Char}$ = \alert{action} avec effets de bord renvoyant un
caractère ($\texttt{IO}$ est un constructeur de type appelé « monade »
I/O).

\bigskip

\itempoint Typage \textbf{linéaire} (forme de typage
« sous-structurel ») ou types à unicité : assure qu'une valeur est
utilisée \alert{une et une seule fois} dans un calcul (ni duplication
ni perte sauf manœuvre spéciale).

\smallskip

Permet d'optimiser la gestion de la mémoire (Rust) et/ou d'annoter les
effets de bord (Clean).

\end{frame}
%
\begin{frame}
\frametitle{Quelques exemples (1)}

Les langages impératifs \emph{tendent} à avoir des systèmes de typage
moins complexes que les langages fonctionnels.

\medskip

{\footnotesize Éviter les termes de typage « faible » et « fort », qui
  veulent tout (ou rien) dire.\par}

\medskip

\itempoint Assembleur (langage machine) : aucun typage (tout est
donnée binaire).

{\footnotesize Idem : machine de Turing, fonctions générales
  récursives (tout est entier), $\lambda$-calcul non typé (tout est
  fonction).\par}

\medskip

\itempoint C : annoté, vérifié à la compilation (\emph{aucune}
vérification à l'exécution), moyennement complexe et contournable
(pointeurs génériques \texttt{void*}).

\medskip

\itempoint Python, JavaScript, Perl, Scheme, etc. : typage vérifié à
l'exécution, superficiel.  Suffisant pour éviter les comportements
indéfinis.

\medskip

\itempoint Java : annoté, mixte compilation/exécution (double
vérification), initialement superficiel (listes non typées), puis
introduction de « génériques » ($\rightarrow$ polymorphisme
paramétrique) avec Java 5, puis diverses sortes d'inférence.

\medskip

\itempoint Rust : interaction avec la gestion de la mémoire
($\approx$ typage linéaire).

\end{frame}
%
\begin{frame}
\frametitle{Quelques exemples (2)}

{\footnotesize Qqs exemples de langages, généralement fonctionnels,
  ayant un système de typage (très) complexe, mélangeant plusieurs
  fonctionnalités évoquées (interactions parfois délicates !) :\par}

\medskip

\itempoint OCaml : inférence de type à la H-M, types récursifs,
polymor\textsuperscript{sme} paramétrique.

\smallskip

Système de « modules » (« signatures » $\approx$ interfaces
abstraites, « foncteurs » entre signatures…), comparable aux
« classes » des langages orientés objet.

\medskip

\itempoint Haskell : beaucoup de similarité avec OCaml :

\smallskip

+ polymorphisme ad hoc : « classes de type », comparable aux
« modules » de OCaml, aux « classes » des langages orientés objet.

\smallskip

+ purement fonctionnel (toutes les fonctions sont « pures ») : les
effets de bord sont enrobés dans des « monades ».

\medskip

\itempoint Mercury (langage de type fonctionnel+logique, inspiré de
Haskell+Prolog) : typage comparable à Haskell ; + sous-typage,
linéarité.

\medskip

\itempoint Idris : langage fonctionnel + assistant de preuve.

\end{frame}
%
\begin{frame}
\frametitle{Quelques curiosités}

\itempoint En F\#, les unités de mesure sont intégrées au système de
typage, qui peut donc vérifier l'homogénéité physique.

\bigskip

\itempoint En Rust, le système de typage évite non seulement les
fuites de mémoire mais aussi certains problèmes de concurrence
(absence de \textit{race condition} sur les données).

\bigskip

\itempoint Certains langages spécialisés assurent, éventuellement en
lien avec leur système de typage, des propriétés diverses de leurs
programmes : terminaison garantie en temps polynomial (Bellantoni \&
Cook 1992), voire constant (langage Usuba), validation XML (langage
CDuce), absence de fuite d'information (langage Flow Caml), etc.

\bigskip

\itempoint En Idris, le système de typage est aussi un système de
preuve (cf. Curry-Howard après) et permet de certifier des invariants
quelconques d'un programme (p.ex., correction d'un algorithme de tri).

\end{frame}
%
\begin{frame}
\label{typing-and-termination}
\frametitle{Typage et terminaison}

Un système de typage \alert{peut} garantir que \textbf{tout programme
  bien typé termine}.

\bigskip

Ce \alert{n'est pas le cas} pour les langages de programmation usuels
(en OCaml, Haskell, etc., un programme bien typé peut faire une boucle
infinie).

\bigskip

Si on veut que le système de typage soit décidable, ceci met forcément
des \alert{limites sur l'expressivité} du langage
($\leftarrow$ indécidabilité du problème de l'arrêt).

\bigskip

Notamment, le langage ne permettra pas d'écrire son propre
interpréteur (même argument « diagonal » que pour les fonctions p.r.
par thm. de réc\textsuperscript{sion} de Kleene).

\bigskip

Notamment aussi : pas de boucle illimitée, pas d'appels récursifs
\emph{non contraints}, pas de type tel que $\mathtt{t} \,\cong\,
(\mathtt{t}\rightarrow \mathtt{t})$.  Aucun terme de type vide !

\bigskip

Néanmoins, le langage peut être \alert{beaucoup plus puissant} que les
fonctions p.r.

\bigskip

Exemple de tel langage : Coq.

\end{frame}
%
\begin{frame}
\frametitle{La correspondance de Curry-Howard (avant-goût)}

Idée générale : établir une analogie, voire une correspondance précise
entre
\begin{itemize}
\item \textbf{types} et \textbf{termes} de ces types dans un système
  de typage,
\item \textbf{propositions} et \textbf{preuves} de ces propositions
  dans un système logique.
\end{itemize}

\smallskip

P.ex., la preuve évidente de l'affirmation $(A \land B) \Rightarrow A$
(« si $A$ et $B$ sont vraies alors $A$ est vraie ») correspond à la
« première projection » de type $a \times b \rightarrow a$.

\smallskip

{\footnotesize Ceci « explique » que le type d'un terme tel que
  $\lambda xy.x$, soit $u \to v \to u$, soit une vérité logique, en
  l'occurrence $U \Rightarrow V \Rightarrow U$ (« si $U$ est vrai
  alors, si $V$ est vrai alors $U$ est vrai »).\par}

\bigskip

Beaucoup de variations sur cette correspondance, mais il y a des
restrictions :
\begin{itemize}
\item le langage informatique doit garantir la terminaison, sinon cela
  reviendrait à permettre les preuves circulaires,
\item la logique concernée est plutôt « intuitionniste » (sans tiers
  exclu),
\item diverses subtilités notamment dans la correspondance entre types
  sommes paramétriques (types $\Sigma$) et $\exists$ côté logique.
\end{itemize}

\end{frame}
%
\begin{frame}
\frametitle{La correspondance de Curry-Howard (premier aperçu)}

{\footnotesize\textcolor{gray}{Divulgâchis pour la suite !}\par}

\smallskip

La correspondance de Curry-Howard fait notamment correspondre :
\begin{itemize}
\item type \textbf{fonction} $A \to B$ avec \textbf{implication}
  logique $A \Rightarrow B$,
\item \textbf{application} d'une fonction ($A \to B$ à un argument de
  type $A$) avec \textbf{\textit{modus ponens}} (si $A \Rightarrow B$
  et $A$, alors $B$),
\item \textbf{abstraction} (= création d'une fonction) avec ouverture
  d'une \textbf{hypothèse} (« supposons $A$ : alors (…) donc $B$ ;
  ceci prouve $A \Rightarrow B$ »),
\item type \textbf{produit} (= couples) $A \times B$ avec
  \textbf{conjonction} (« et ») logique $A \land B$,
\item type \textbf{somme} $A + B$ avec \textbf{disjonction} (« ou »)
  logique $A \lor B$,
\item types \textbf{trivial} ($\texttt{Unit}$) et \textbf{vide} avec
  \textbf{vrai} $\top$ et \textbf{faux} $\bot$ logiques,
\item mais pour la \textbf{négation}…  c'est plus délicat.
\end{itemize}

\bigskip

{\footnotesize Les détails demandent un système de typage et un
  système logique précisément définis.\par}

\end{frame}
%
\begin{frame}
\frametitle{Paradoxe de Curry (interlude distrayant)}

{\footnotesize Variante plus sophistiquée de « cette phrase est
  fausse ».  C'est un exemple de preuve circulaire
  ($\leftrightarrow$ combinateur $\mathsf{Y}$ de Curry par la
  correspondance de C-H), invalide en logique.\par}

\medskip

Je tiens l'affirmation : « \textcolor{teal}{si j'ai raison, alors je
  suis un grand génie} ».

\begin{itemize}
\item clairement, si j'ai raison, je suis un grand génie ;
\item mais c'était justement mon affirmation : donc j'ai raison ;
\item donc je suis un grand génie. \qedsymbol
\end{itemize}

{\footnotesize Remplacer « j'ai raison » par « cette phrase est
  vraie » (voire utiliser l'astuce de Quine pour éviter « cette
  phrase ») et « je suis un grand génie » par absolument n'importe
  quoi.\par}

\bigskip

\itempoint Ce qui est correct : \alert{si on peut construire} un
énoncé $A$ tel que $A \Leftrightarrow (A \Rightarrow B)$ (ici $A$ est
l'affirmation tenue et $B$ est la conclusion voulue) alors $B$ vaut :
\[
(A \Leftrightarrow (A \Rightarrow B)) \, \Rightarrow \, B
\]

{\footnotesize (Preuve correcte : supposons $A$ : par hypothèse, ceci
  signifie $A \Rightarrow B$ ; on a donc $B$ ; tout ceci prouve $A
  \Rightarrow B$.  Bref on a $A \Rightarrow B$.  Mais par hypothèse
  c'est $A$.  Donc $A$ vaut.  Donc $B$ aussi.)\par}

\medskip

\itempoint Ce qui est \textcolor{orange}{fallacieux} : la supposition
tacite qu'on peut construire un tel $A$.

{\footnotesize L'astuce de Quine permet de faire une auto-référence
  sur la syntaxe, pas sur la vérité.\par}

\end{frame}
%
\begin{frame}
\frametitle{Théories des types pour la logique (très bref aperçu)}

\itempoint Langages spécialisés pour servir à la fois à l'écriture de
programmes informatiques et de preuves mathématiques ; ils peuvent
être soit sous forme de systèmes abstraits, soit sous forme
d'implémentation informatique (« assistants de preuve » : Coq, Agda,
Lean…).

\bigskip

\itempoint Dans tous les cas il s'agit de langages assurant la
terminaison des programmes (cf. transp. \ref{typing-and-termination}),
ou, puisqu'il s'agit de variantes du $\lambda$-calcul, la
\emph{normalisation forte}.  Le type vide doit être inhabité !

\bigskip

Quelques grandes familles (chacune avec énormément de variantes) :
\begin{itemize}
\item théories des types à la Martin-Löf (« MLTT ») : suit jusqu'au
  bout la correspondance de Curry-Howard (\emph{aucune} distinction
  entre types et propositions ; {\footnotesize pas de $\exists$ mais
    plutôt un $\Sigma$}), $\rightarrow$ Agda ;
\item variantes du « calcul des constructions » (« CoC »),
  $\rightarrow$ Coq ;
\item théorie homotopique des types (« HoTT ») : « égalité = isomorphisme ».
\end{itemize}

\end{frame}
%
\begin{frame}
\frametitle{Le $\lambda$-cube de Barendregt (très bref aperçu)}

Il s'agit d'un ensemble de $8 = 2^3$ théories des types pour la
logique : la plus faible est le « $\lambda$-calcul simplement typé »
($\lambda_\rightarrow$, décrit plus loin), la plus forte le « calcul
des constructions » (« CoC »).

\medskip

Chaque théorie du cube est caractérisée par l'absence ou la présence
de chacune des $3$ fonctionnalités suivantes ($\lambda_\rightarrow$
n'a aucune des trois, CoC a les trois) :

\begin{itemize}
\item \textcolor{blue}{termes pouvant dépendre de types}, ou
  polymorphisme paramétrique « explicitement quantifié » (p.ex. $\prod
  t.\; (t \rightarrow t)$) ;
\item \textcolor{blue}{types pouvant dépendre de types}, ou
  constructeurs de types ;
\item \textcolor{blue}{types pouvant dépendre de termes}, ou « types
  dépendants », correspondant côté logique à la quantification sur les
  individus.
\end{itemize}

\medskip

{\footnotesize On peut ensuite encore ajouter des fonctionnalités :
  par exemple, Coq est basé sur le « calcul des constructions
  inductives » qui ajoute au calcul des constructions des mécanismes
  systématiques pour former des types (positivement !) récursifs.\par}

\end{frame}
%
\section{Le \texorpdfstring{$\lambda$}{lambda}-calcul simplement typé}
\begin{frame}
\frametitle{Le $\lambda$-calcul simplement typé : description sommaire}

\itempoint Le $\lambda$-calcul simplement typé (=: $\lambda$CST ou
$\lambda_\rightarrow$) est une \alert{variante typée} du
$\lambda$-calcul, assurant la propriété de terminaison (normalisation
forte).

\medskip

\itempoint Il a une seule opération sur les types, le type
\textbf{fonction} : donnés deux types $\sigma,\tau$, on a un type
$\sigma\to\tau$ pour les fonctions de l'un vers l'autre.

\medskip

\itempoint L'application et l'abstraction doivent respecter le
typage :
\begin{itemize}
\item si $P$ a pour type $\sigma\to\tau$ et $Q$ a type $\sigma$ alors $PQ$
  a pour type $\tau$,
\item si $E$ a pour type $\tau$ en faisant intervenir une variable $v$
  libre de type $\sigma$ alors $\lambda(v:\sigma).E$ {\footnotesize
    (« fonction prenant $v$ de type $\sigma$ et renvoyant $E$ »)} a
  pour type $\sigma\to\tau$.
\end{itemize}

\medskip

\itempoint Typage \textbf{annoté} (=« à la Church ») : on écrit
$\lambda(v:\sigma).E$ pas juste $\lambda v.E$.

\medskip

\itempoint On notera « $x_1:\sigma_1,\ldots,x_k:\sigma_k \vdash
E:\tau$ » pour dire « $E$ est bien typé avec pour type $\tau$ lorsque
$x_1,\ldots,x_k$ sont des variables libres de types
$\sigma_1,\ldots,\sigma_k$ :
\begin{itemize}
\item $x_1:\sigma_1,\ldots,x_k:\sigma_k$ s'appelle un
  \textbf{contexte} de typage (souvent $\Gamma$),
\item $\Gamma \vdash E:\tau$ s'appelle un \textbf{jugement} de typage.
\end{itemize}

\end{frame}
%
\begin{frame}
\frametitle{Exemples de termes et de typages}

{\footnotesize On donnera les règles précises plus tard, commençons
  par quelques exemples.\par}

\begin{itemize}
\item $f:\alpha\to\beta,\; x:\alpha \;\vdash\; fx:\beta$\\ Lire : « dans le
  contexte où $f$ est une variable de type $\alpha\to\beta$ et $x$ une
  variable de type $\alpha$, alors $fx$ est de type $\beta$ ».
\item $f:\beta\to\alpha\to\gamma,\; x:\alpha,\; y:\beta \;\vdash\; fyx
  : \gamma$\\ {\footnotesize (Parenthéser $\beta\to\alpha\to\gamma$
  comme $\beta\to(\alpha\to\gamma)$ et $fyx$ comme $(fy)x$.)}
\item $f:\beta\to\alpha\to\gamma,\; x:\alpha \;\vdash\;
  \lambda(y:\beta).fyx \;:\; \beta\to\gamma$\\ {\footnotesize
    Comprendre $\lambda(y:\beta).fyx$ comme « fonction prenant $y$ de
    type $\beta$ et renvoyant $fyx$ ».}
\item $x:\alpha \;\vdash\;
  \lambda(f:\alpha\to\beta).fx\;:\;(\alpha\to\beta)\to\beta$\\ « Si
  $x$ est de type $\alpha$ alors le terme
  $\lambda(f:\alpha\to\beta).fx$ est de type
  $(\alpha\to\beta)\to\beta$. »
\item $\vdash\; \lambda(x:\alpha).
  \lambda(f:\alpha\to\beta).fx\;:\;\alpha\to(\alpha\to\beta)\to\beta$\\ « Le
  terme $\lambda(x:\alpha).\lambda(f:\alpha\to\beta).fx$ a type
  $\alpha\to(\alpha\to\beta)\to\beta$ dans le contexte
  vide. »\\ {\footnotesize (Parenthéser
    $\alpha\to(\alpha\to\beta)\to\beta$ comme
    $\alpha\to((\alpha\to\beta)\to\beta)$.)}
\end{itemize}

\end{frame}
%
\begin{frame}
\frametitle{Types et prétermes}

\itempoint Un \textbf{type} du $\lambda$CST est (inductivement) :
\begin{itemize}
\item une \textbf{variable de type} ($\alpha$, $\beta$, $\gamma$... en nombre illimité),
\item un \textbf{type fonction} $(\sigma\to\tau)$ où $\sigma$ et $\tau$
  sont deux types.
\end{itemize}

\bigskip

\itempoint Un \textbf{préterme} du $\lambda$CST est (inductivement) :
\begin{itemize}
\item une \textbf{variable de terme} ($a$, $b$, $c$... en nombre illimité),
\item une \textbf{application} $(PQ)$ où $P$ et $Q$ sont deux termes,
\item une \textbf{abstraction} $\lambda(v:\sigma).E$ où $v$ est une
  variable, $\sigma$ un type et $E$ un terme.
\end{itemize}

\medskip

\itempoint Conventions d'écriture :
\begin{itemize}
\item « $\rho\to\sigma\to\tau$ » signifie
  « $(\rho\to(\sigma\to\tau))$ » ; « $xyz$ » signifie
  « $((xy)z)$ » ;
\item on note « $\lambda (x:\sigma,t:\tau).E$ » pour « $\lambda
  (x:\sigma). \lambda (t:\tau). E$ » ;
\item l'abstraction est moins prioritaire que l'application ;
\item on considère les termes à renommage près des variables liées
  {\footnotesize ($\alpha$-conversion)}.
\end{itemize}

\end{frame}
%
\begin{frame}
\frametitle{Règles de typage}

\itempoint Un \textbf{typage} est la donnée d'un préterme $M$ et d'un
type $\sigma$.  On note « $M:\sigma$ ».

\medskip

\itempoint Un \textbf{contexte} est un ensemble fini $\Gamma$ de
typages $x_i:\sigma_i$ où $x_1,\ldots,x_k$ sont des \alert{variables}
de terme \alert{distinctes}.  On le note
« $x_1:\sigma_1,\ldots,x_k:\sigma_k$ ».

\medskip

\itempoint Un \textbf{jugement} de typage est la donnée d'un contexte
$\Gamma$ et d'un typage $E:\tau$, sujet aux règles ci-dessous.  On
note $\Gamma \vdash E:\tau$ (ou juste $\vdash E:\tau$ si $\Gamma =
\varnothing$), et on dit que $E$ est un « \textbf{terme} (= bien typé)
de type $\tau$ dans le contexte $\Gamma$ ».

\medskip

\textbf{Règles} de typage du $\lambda$CST : {\footnotesize (quels que
  soient $\Gamma,x,\sigma,\ldots$,)}
\begin{itemize}
\item \textcolor{olive}{(« variable »)} si $(x:\sigma) \in \Gamma$
  alors $\Gamma \vdash x:\sigma$ ;
\item \textcolor{olive}{(« application »)} si $\Gamma \vdash
  P:\sigma\to\tau$ et $\Gamma \vdash Q:\sigma$ alors $\Gamma \vdash
  PQ:\tau$ ;
\item \textcolor{olive}{(« abstraction »)} si $\Gamma, v:\sigma \vdash
  E:\tau$ alors $\Gamma \vdash \lambda(v:\sigma).E : \sigma\to\tau$.
\end{itemize}

\smallskip

{\footnotesize (Comprendre : l'ensemble des jugements de typage est
  l'ensemble engendré par les règles ci-dessus, i.e., le plus petit
  ensemble qui les respecte.)\par}

\medskip

\itempoint Une \textbf{dérivation} d'un jugement est un arbre
(d'instances de) règles qui aboutit au jugement considéré.

\end{frame}
%
\begin{frame}
\frametitle{Représentation des règles de typage}

Les trois règles de typage du $\lambda$CST :

\[
\inferrule*[left=\llap{Var}]{ }{\Gamma,x:\sigma \vdash x:\sigma}
\]

\[
\inferrule*[left=\llap{App},sep=4em]{\Gamma \vdash P:\sigma\to\tau\\ \Gamma
  \vdash Q:\sigma}{\Gamma \vdash PQ:\tau}
\]

\[
\inferrule*[left=\llap{Abs}]{\Gamma, v:\sigma \vdash E:\tau}{\Gamma
  \vdash \lambda(v:\sigma).E : \sigma\to\tau}
\]

\bigskip

\itempoint Chaque « fraction » indique que le jugement écrit
\alert{en-dessous} découle par la règle inscrite \alert{à côté} à
partir des hypothèses portées \alert{au-dessus}.

\end{frame}
%
\begin{frame}
\frametitle{Exemple de dérivation}

Montrons le jugement selon lequel
$\lambda(f:\beta\to\alpha\to\gamma). \lambda(x:\alpha). \lambda(y:\beta). fyx$
est un terme de type $(\beta\to\alpha\to\gamma) \to
(\alpha\to\beta\to\gamma)$ dans le contexte vide :

\vskip-2ex

{\footnotesize
\[
\inferrule*[left=\llap{Abs}]{
\inferrule*[left=\llap{Abs}]{
\inferrule*[left=\llap{Abs}]{
\inferrule*[left=\llap{App}]{
\inferrule*[left=\llap{App}]{
\inferrule*[left=\llap{Var}]{ }{\mbox{$\begin{array}{cc}\scriptscriptstyle f:\beta\to\alpha\to\gamma,\\ \scriptscriptstyle x:\alpha,y:\beta\\ \end{array}$} \vdash f : \beta\to\alpha\to\gamma}
\\
\inferrule*[right=\rlap{Var}]{ }{\mbox{$\begin{array}{cc}\scriptscriptstyle f:\beta\to\alpha\to\gamma,\\ \scriptscriptstyle x:\alpha,y:\beta\\ \end{array}$} \vdash y : \beta}
}{\mbox{$\begin{array}{cc}\scriptscriptstyle f:\beta\to\alpha\to\gamma,\\ \scriptscriptstyle x:\alpha,y:\beta\\ \end{array}$} \vdash fy : \alpha\to\gamma}
\\
\inferrule*[right=\rlap{Var}]{ }{\mbox{$\begin{array}{cc}\scriptscriptstyle f:\beta\to\alpha\to\gamma,\\ \scriptscriptstyle x:\alpha,y:\beta\\ \end{array}$} \vdash x : \alpha}
}{f:\beta\to\alpha\to\gamma, x:\alpha, y:\beta \vdash fyx : \gamma}
}{f:\beta\to\alpha\to\gamma, x:\alpha \vdash \lambda(y:\beta). fyx : \beta\to\gamma}
}{f:\beta\to\alpha\to\gamma \vdash \lambda(x:\alpha). \lambda(y:\beta). fyx : \alpha\to\beta\to\gamma}
}{\vdash \lambda(f:\beta\to\alpha\to\gamma). \lambda(x:\alpha). \lambda(y:\beta). fyx : (\beta\to\alpha\to\gamma) \to (\alpha\to\beta\to\gamma)}
\]
\par}

Chaque barre horizontale justifie le jugement écrit \alert{en-dessous}
par la règle inscrite \alert{à côté} à partir des hypothèses portées
\alert{au-dessus}.

\medskip

Ceci est typographiquement abominable et hautement redondant, ce qui
explique qu'on écrive rarement de tels arbres complètement.

\end{frame}
%
\begin{frame}
\frametitle{Propriétés du typage}

Les propriétés suivantes sont faciles mais utiles :

\medskip

\itempoint \textbf{Affaiblissement :} si $\Gamma \subseteq \Gamma'$
sont deux contextes et $\Gamma \vdash M:\sigma$ alors $\Gamma' \vdash
M:\sigma$ aussi.

\smallskip

{\footnotesize On pouvait présenter les règles en limitant la règle
  « variable » à « $x:\sigma \vdash x:\sigma$ » et en prenant
  l'affaiblissement comme règle.  C'est peut-être préférable.\par}

\medskip

\itempoint \textbf{Duplication :} si $\Gamma, x:\rho, x':\rho \vdash
M:\sigma$ alors $\Gamma, x:\rho \vdash M[x'\backslash x]:\sigma$ aussi
(où $M[x'\backslash x]$ désigne la substitution correcte de $x'$
par $x$).

\smallskip

{\footnotesize \emph{Remarque :} Le typage linéaire supprime notamment
  l'affaiblissement et la duplication.\par}

\medskip

\itempoint \textbf{Variables libres :} si
$x_1:\sigma_1,\ldots,x_k:\sigma_k \vdash E:\tau$ alors toute variable
libre de $E$ est une des $x_1,\ldots,x_k$.

\medskip

\itempoint \textbf{Variables inutiles :} si $\Gamma \vdash E:\tau$
alors $\Gamma|_{\operatorname{free}(E)} \vdash E:\tau$ où
$\Gamma|_{\operatorname{free}(E)}$ est la partie de $\Gamma$
concernant les variables libres de $E$.

\medskip

\itempoint \textbf{Renommage :} si $\Gamma \vdash E:\tau$ alors ceci
vaut encore après tout renommage des variables libres.

\end{frame}
%
\begin{frame}
\frametitle{Construction de la dérivation}

La dérivation du jugement de typage $\Gamma \vdash M : \sigma$ d'un
(pré)terme $M$ du $\lambda$CST se construit systématiquement et
évidemment à partir de $M$ (\alert{aucun choix} à faire !) :
\begin{itemize}
\item si $M = x$ est une variable, alors un $x:\sigma$ doit être dans
  le contexte $\Gamma$ (sinon : échouer), et la dérivation est par la
  règle « variable » ;
\item si $M = PQ$ est une application, construire des dérivations de
  jugements $\Gamma \vdash P : \rho$ et $\Gamma \vdash Q : \sigma$, on
  doit avoir $\rho = (\sigma\to\tau)$ (sinon : échouer), et la
  dérivation est par la règle « application » ;
\item si $M = \lambda(v:\sigma).E$ est une abstraction, construire une
  dérivation de jugement $\Gamma' \vdash E : \tau$ dans $\Gamma' :=
  \Gamma \cup \{v:\sigma\}$ {\footnotesize (quitte à renommer $v$)},
  et la dérivation est par la règle « abstraction ».
\end{itemize}

\bigskip

\itempoint \textbf{Donc :} aussi bien la vérification de type
(vérifier $\Gamma \vdash M : \sigma$) que l'assignation de type
(trouver $\sigma$ à partir de $\Gamma,M$) sont (très facilement)
\alert{décidables} dans le $\lambda$CST.  De plus, $\sigma$ est
\alert{unique} (donnés $\Gamma$ et $M$).

\end{frame}
%
\begin{frame}
\frametitle{Problèmes faciles et moins faciles}

\itempoint Facile (transp. précédent) : donné un (pré)terme $M$,
trouver son (seul possible) type $\sigma$ est facile (notamment :
vérifier que $M$ est un terme = bien typé, ou vérifier un jugement de
type).

\smallskip

\textcolor{blue}{Le terme donne directement l'arbre de dérivation.}

\bigskip

\itempoint Facile aussi : réciproquement, donné un arbre de dérivation
où on a effacé les termes pour ne garder que les types, retrouver un
terme (transp. suivant).

\smallskip

\textcolor{blue}{L'arbre de dérivation redonne directement le terme.}

\bigskip

\itempoint Moins facile : donné un terme « désannoté », i.e., un terme
du $\lambda$-calcul non typé, p.ex. $\lambda xyz.xz(yz)$, savoir s'il
correspond à un terme (typable) du $\lambda$CST.

\smallskip

\textcolor{brown}{$\rightarrow$ Algorithme de Hindley-Milner.}

\bigskip

\itempoint Moins facile : donné un type, savoir s'il existe un terme
ayant ce type.

\smallskip

\textcolor{brown}{$\rightarrow$ Décidabilité du calcul propositionnel
  intuitionniste.}

\end{frame}
%
\begin{frame}
\frametitle{Reconstruction du terme typé}

Peut-on retrouver les termes manquants dans un arbre de dérivation
dont on n'a donné que les types et les règles appliquées ?

{\footnotesize
\[
\inferrule*[left=\llap{Abs}]{
\inferrule*[left=\llap{Abs}]{
\inferrule*[left=\llap{Abs}]{
\inferrule*[left=\llap{App}]{
\inferrule*[left=\llap{App}]{
\inferrule*[left=\llap{Var}]{ }{\mbox{$\begin{array}{cc}\scriptscriptstyle \textbf{?}:\beta\to\alpha\to\gamma,\\ \scriptscriptstyle \textbf{?}:\alpha,\textbf{?}:\beta\\ \end{array}$} \vdash \textbf{?} : \beta\to\alpha\to\gamma}
\\
\inferrule*[right=\rlap{Var}]{ }{\mbox{$\begin{array}{cc}\scriptscriptstyle \textbf{?}:\beta\to\alpha\to\gamma,\\ \scriptscriptstyle \textbf{?}:\alpha,\textbf{?}:\beta\\ \end{array}$} \vdash \textbf{?} : \beta}
}{\mbox{$\begin{array}{cc}\scriptscriptstyle \textbf{?}:\beta\to\alpha\to\gamma,\\ \scriptscriptstyle \textbf{?}:\alpha,\textbf{?}:\beta\\ \end{array}$} \vdash \textbf{?} : \alpha\to\gamma}
\\
\inferrule*[right=\rlap{Var}]{ }{\mbox{$\begin{array}{cc}\scriptscriptstyle \textbf{?}:\beta\to\alpha\to\gamma,\\ \scriptscriptstyle \textbf{?}:\alpha,\textbf{?}:\beta\\ \end{array}$} \vdash \textbf{?} : \alpha}
}{\textbf{?}:\beta\to\alpha\to\gamma, \textbf{?}:\alpha, \textbf{?}:\beta \vdash \textbf{?} : \gamma}
}{\textbf{?}:\beta\to\alpha\to\gamma, \textbf{?}:\alpha \vdash \textbf{?} : \beta\to\gamma}
}{\textbf{?}:\beta\to\alpha\to\gamma \vdash \textbf{?} : \alpha\to\beta\to\gamma}
}{\vdash \textbf{?} : (\beta\to\alpha\to\gamma) \to (\alpha\to\beta\to\gamma)}
\]
\par}

\textbf{Oui} (aux noms des variables près) à condition, en cas de
types identiques dans le contexte, d'identifier l'élément utilisé pour
chaque règle « variable ».

\bigskip

\itempoint\textcolor{blue}{Le terme typé représente exactement l'arbre
  de dérivation} du jugement le concernant.

\end{frame}
%
\begin{frame}
\frametitle{Lemme de substitution}

\itempoint\textbf{Lemme :} Si $\Gamma, v:\sigma \vdash E : \tau$ et
$\Gamma \vdash T : \sigma$ alors $\Gamma \vdash E[v\backslash T] :
\tau$, où $E[v\backslash T]$ désigne le terme obtenu par substitution
correcte de $v$ par $v$ dans $E$.

\bigskip

\underline{Esquisse de preuve :} reprendre l'arbre de dérivation de
$\Gamma, v:\sigma \vdash E : \tau$ en supprimant $v:\sigma$ du
contexte et en substituant $v$ par $E$ partout à droite du ‘$\vdash$’.
Les règles s'appliquent à l'identique, sauf la règle « variable »
introduisant $v:\sigma$, qui est remplacée par l'arbre de dérivation
de $\Gamma \vdash T : \sigma$.\qed

\medskip

\centerline{*}

\medskip

Remarquer la similarité entre
\[
\inferrule*[left=App]{
\inferrule*[left=Abs]{\Gamma, v:\sigma \vdash E : \tau}{
\Gamma \vdash \lambda(v:\sigma).E : \sigma\to\tau}
\\
\Gamma \vdash T : \sigma
}{\Gamma \vdash (\lambda(v:\sigma).E)T : \tau}
\]
et
\[
\inferrule*[left=Subs]{\Gamma, v:\sigma \vdash E : \tau
\\
\Gamma \vdash T : \sigma
}{\Gamma \vdash E[v\backslash T] : \tau}
\]

\end{frame}
%
\begin{frame}
\frametitle{Typage et $\beta$-réduction}

On rappelle que la « $\beta$-réduction » désigne le remplacement en
sous-expression d'un « redex » $(\lambda (v:\sigma). E)T$ par son
« réduit » $E[v\backslash T]$.

\medskip

On note $X \rightarrow_\beta X'$ pour une $\beta$-réduction, et $X
\twoheadrightarrow_\beta X'$ pour une suite de $\beta$-réductions.

\bigskip

\itempoint D'après le lemme de substitution, si $\Gamma \vdash
(\lambda (v:\sigma). E)T : \tau$ alors on a aussi $\Gamma \vdash
E[v\backslash T] : \tau$.

\bigskip

\itempoint Toujours d'après ce lemme, si $X \twoheadrightarrow_\beta
X'$ et $\Gamma \vdash X:\tau$ alors $\Gamma \vdash X':\tau$.

\bigskip

\textcolor{blue}{\textbf{Moralité :}} le typage est compatible avec
l'évaluation du $\lambda$-calcul (un terme bien typé reste bien typé
quand on effectue la $\beta$-réduction et le type ne change pas).

\end{frame}
%
\begin{frame}
\frametitle{Normalisation forte}

\itempoint\textbf{Théorème} (Turing, Tait, Girard) : le
$\lambda$-calcul simplement typé est \textbf{fortement normalisant},
c'est-à-dire que toute suite de $\beta$-réductions sur un terme
(bien typé !) termine.

\bigskip

{\footnotesize

\textcolor{blue}{Idée cruciale de la preuve :} une induction directe
échoue ($P,Q$ fortement normalisables $\not\Rightarrow$ $PQ$ fortement
normalisable).  À la place, on introduit une notion \emph{plus forte}
permettant l'induction :

\smallskip

\itempoint\textbf{Définition} technique : un terme $P$ de type $\rho$
est dit « fortement calculable » lorsque :
\begin{itemize}
\item si $\rho = \alpha$ est une variable de type (type
  « atomique ») : $P$ est fortement normalisable,
\item si $\rho = (\sigma\to\tau)$ est un type fonction : pour
  \alert{tout} $Q$ de type $\sigma$ fortement calculable, $PQ$ est
  fortement calculable.
\end{itemize}

\smallskip

On prouve alors successivement :
\begin{itemize}
\item tout terme fortement calculable est fortement normalisable
  (induction facile sur le type),
\item si $x_1:\sigma_1,\ldots,x_k:\sigma_k \vdash E:\tau$ et si
  $v_1,\ldots,v_k$ sont de types $\sigma_1,\ldots,\sigma_k$, fortement
  calculables et n'impliquant pas $x_1,\ldots,x_k$, alors la
  substitution de $v_i$ pour $x_i$ dans $E$ est fortement calculable
  (preuve par induction sur la dérivation du jugement, i.e., induction
  sur $E$ : le cas délicat est l'abstraction).
\end{itemize}

\par}

\end{frame}
%
\end{document}