summaryrefslogtreecommitdiffstats
path: root/transp-inf110-02-typage.tex
blob: 17897a03d270f94c0c55abb63efa42bfcd1f83da (plain)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
%% This is a LaTeX document.  Hey, Emacs, -*- latex -*- , get it?
\documentclass[mathserif,a4paper,aspectratio=169]{beamer}
%\documentclass[a4paper]{article}
%\usepackage[envcountsect,noxcolor]{beamerarticle}
\usepackage[shorthands=off,french]{babel}
\usepackage[utf8]{inputenc}
\usepackage[T1]{fontenc}
\usepackage{lmodern}
\DeclareUnicodeCharacter{00A0}{~}
\DeclareUnicodeCharacter{2026}{...}
\DeclareUnicodeCharacter{1E25}{\d{h}}
% Beamer theme:
\usetheme{Goettingen}
%\usecolortheme{albatross}
%\usecolortheme{lily}
%\setbeamercovered{transparent}
% A tribute to the worthy AMS:
\usepackage{amsmath}
\usepackage{amsfonts}
\usepackage{amssymb}
\usepackage{amsthm}
%
\usepackage{mathrsfs}
%
\usepackage{graphicx}
\usepackage{tikz}
\usetikzlibrary{arrows,automata,calc}
%
\newcommand{\itempoint}{\strut\hbox{\color{beamerstructure}\donotcoloroutermaths$\blacktriangleright$}\nobreak\hskip.5em plus.5em\relax}
\renewcommand{\thefootnote}{\textdagger}
\newcommand{\dbllangle}{\mathopen{\langle\!\langle}}
\newcommand{\dblrangle}{\mathclose{\rangle\!\rangle}}
%
%
%
\title{Typage simple}
\subtitle{INF110 (Logique et Fondements de l'Informatique)}
\author[David Madore]{David A. Madore\\
{\footnotesize Télécom Paris}\\
\texttt{david.madore@enst.fr}}
\date{2023–2024}
\mode<presentation>{%
\beamertemplatenavigationsymbolsempty
\usenavigationsymbolstemplate{\vbox{\hbox{\footnotesize\hyperlinkslideprev{$\leftarrow$}\insertframenumber/\inserttotalframenumber\hyperlinkslidenext{$\rightarrow$}}}}
}
\setbeamercolor{myhighlight}{fg=black,bg=white!90!green}
\begin{document}
\mode<article>{\maketitle}
%
\setlength\abovedisplayskip{2pt plus 2pt minus 2pt}
\setlength\belowdisplayskip{2pt plus 2pt minus 2pt}
%
\begin{frame}
\titlepage
{\footnotesize\center{\url{http://perso.enst.fr/madore/inf110/transp-inf110.pdf}}\par}
{\tiny
\immediate\write18{sh ./vc > vcline.tex}
\begin{center}
Git: \input{vcline.tex}
\end{center}
\immediate\write18{echo ' (stale)' >> vcline.tex}
\par}
\end{frame}
%
\section*{Plan}
\begin{frame}
\frametitle{Plan}
\tableofcontents
\end{frame}
%
\section{Généralités sur le typage}
\begin{frame}
\frametitle{Qu'est-ce que le typage ?}

{\footnotesize Philosophie opposée du « codage de Gödel » en
  calculabilité, lequel représente toute donnée finie par un
  entier.\par}

\medskip

\itempoint Informellement, un \textbf{système de typage} est une façon
d'affecter à toute \alert{expression} et/ou \alert{valeur} manipulée
par un langage informatique un \textbf{type} qui contraint son usage
{\footnotesize (p.ex., « entier », « fonction », « chaîne de
  caractères »)}.

\medskip

\textbf{Buts :}
\begin{itemize}
\item attraper plus tôt des \textbf{erreurs de programmation}
  {\footnotesize (« ajouter un entier et une chaîne de caractères »
    est probablement une erreur, ou demande une conversion
    explicite)},
\item éviter des \textbf{plantages ou problèmes de sécurité}
  {\footnotesize (exécution d'un entier)},
\item garantir certaines \textbf{propriétés du comportement} des
  programmes ($\rightarrow$ analyse statique), forcément de façon
  limitée (cf. théorème de Rice), p.ex., la \alert{terminaison},
\item aider à l'\textbf{optimisation} {\footnotesize (fonction pure :
  sans effet de bord)}.
\end{itemize}

\medskip

{\footnotesize Cf. systèmes d'unités (homogénéité) en physique.\par}

\end{frame}
%
\begin{frame}
\frametitle{Variétés de typage}

Il y a autant de systèmes de typage que de langages de programmation !

\medskip

\itempoint Typage \textbf{statique} (à compilation) vs
\textbf{dynamique} (à exécution) ou mixte.

{\footnotesize En général on préfère : erreur à la compilation $>$
  erreur à l'exécution $>$ plantage.\par}

\medskip

\itempoint Typage \textbf{inféré} par le langage ou \textbf{annoté}
par le programmeur.

{\footnotesize Type = promesse donnée par le langage au
  programmeur ou par le programmeur au langage ?\par}

\medskip

\itempoint Typage « sûr » ou partiel/contournable (\textit{cast} de
la valeur, manipulation de la représentation mémoire, suppression ou
report à l'exécution de vérification).

\medskip

\itempoint Typage superficiel {\footnotesize (« ceci est une liste »)}
ou complexe {\footnotesize (« ceci est une liste d'entiers »)}.

\medskip

\itempoint Diverses annotations possibles {\footnotesize (« cette
  fonction est pure », « soulève une exception »)}.

\medskip

\itempoint Liens avec les mécanismes de sécurité (qui peut faire
quoi ?), de gestion de la mémoire (système de typage linéaire),
l'évaluation (exceptions), la mutabilité.

\medskip

\itempoint Les types sont-ils citoyens de première classe
           {\footnotesize (:= manipulables dans le langage)} ?

{\footnotesize Juvénal : « Quis custodiet ipsos custodes? » Quel est
  le type des types eux-mêmes ?\par}

\end{frame}
%
\begin{frame}
\frametitle{Opérations de base sur les types}

En plus de types de base (p.ex. $\texttt{Nat}$ = entiers,
$\texttt{Bool}$ = booléens), les opérations suivantes sur les types
sont \emph{souvent} proposées par les systèmes de typage :

\bigskip

\itempoint Types \textbf{produits} (= paires, triplets, $k$-uplets).
P.ex. $\texttt{Nat} \times \texttt{Bool}$ = type des paires formées
d'un entier et d'un booléen.

\smallskip

Composantes éventuellement nommées $\rightarrow$ structures
(= enregistrements).

\smallskip

Produit vide = type trivial, $\texttt{Unit}$ (une seule valeur).

\bigskip

\itempoint Types \textbf{sommes} (= unions).  P.ex. $\texttt{Nat} +
\texttt{Bool}$ = type pouvant contenir un entier \emph{ou} un booléen,
avec un \alert{sélecteur} de cas.

\smallskip

Cas particulier : $\texttt{Unit} + \cdots + \texttt{Unit}$ = type
« énumération » (pur sélecteur).

\smallskip

Somme vide = type inhabité (impossible : aucune valeur).

\bigskip

\itempoint Types \textbf{fonctions} (= exponentielles).
P.ex. $\texttt{Nat} \rightarrow \texttt{Bool}$.

\bigskip

\itempoint Types \textbf{listes}.  P.ex. $\texttt{List}~\texttt{Nat}$
= type des listes d'entiers.

\end{frame}
%
\begin{frame}
\frametitle{Quelques fonctionnalités fréquentes}

\itempoint \textbf{Sous-typage} = les valeurs d'un type sont
automatiquement des valeurs possibles d'un autre.

\bigskip

\itempoint \textbf{Polymorphisme} = utilisation de plusieurs types
possibles, voire de n'importe quel type (cf. transp. suivant).
P.ex. la fonction « identité » $(\forall\mathtt{t})\; \mathtt{t}
\rightarrow \mathtt{t}$.

\bigskip

\itempoint \textbf{Constructeurs de types} = fabriquent un type à
partir d'un (ou plusieurs) autres.  P.ex. $\texttt{List}$ (fabrique le
type « liste de $\mathtt{t}$ » à partir de $\mathtt{t}$).

\bigskip

\itempoint \textbf{Types récursifs} = construits par les opérateurs
(produits, sommes, fonctions, constructeurs…) à partir des types
définis eux-mêmes.  P.ex. $\texttt{Tree} =
\texttt{List}~\texttt{Tree}$.

\bigskip

\itempoint \textbf{Types dépendants} = un type à partir d'une valeur.
P.ex. $k \mapsto \texttt{Nat}^k$.

\bigskip

\itempoint \textbf{Types opaques} (abstraits, privés…) = types dont
les valeurs sont cachées, l'usage est limité à une interface publique.

\end{frame}
%
\begin{frame}
\frametitle{Polymorphisme}

On distingue deux (trois ?) sortes de polymorphismes :

\medskip

\itempoint Polymorphisme \textbf{paramétrique} (ou « génériques ») :
la même fonction \alert{s'applique à l'identique} à une donnée de
n'importe quel type.

\smallskip

Exemples :
\begin{itemize}
\item $\texttt{head} : (\forall\mathtt{t})\; \texttt{List}~\mathtt{t} \to \mathtt{t}$ (renvoie le premier élément d'une liste)
\item $\lambda xy.\langle x,y\rangle :
  (\forall\mathtt{u},\mathtt{v})\; \mathtt{u} \to \mathtt{v} \to
  \mathtt{u}\times \mathtt{v}$ (fabrique un couple)
\item $\lambda xyz.xz(yz) :
  (\forall\mathtt{u},\mathtt{v},\mathtt{w})\; (\mathtt{u} \to
  \mathtt{v} \to \mathtt{w}) \to (\mathtt{u} \to
  \mathtt{v}) \to \mathtt{u} \to
  \mathtt{w}$
\end{itemize}

\smallskip

Pas seulement pour les fonctions !  $\texttt{[]} :
(\forall\mathtt{t})\; \texttt{List}~\mathtt{t}$ (liste vide)

\smallskip

{\footnotesize Et même : $\texttt{while~true~do~pass} :
  (\forall\mathtt{t})\; \mathtt{t}$ (boule infinie)\par}

\bigskip

\itempoint Polymorphisme \textbf{ad hoc} (ou « surcharge » /
« \textit{overloading} ») : la fonction \alert{agit différemment} en
fonction du type de son argument (connu à la compilation !).

\bigskip

{\footnotesize Le sous-typage est parfois considéré comme une forme de
  polymorphisme, voire la coercion (\textit{cast}).  Les limites de
  ces notions sont floues.\par}

\end{frame}
%
\begin{frame}
\frametitle{Utilisations du typage au-delà des valeurs stockées}

\itempoint Annotation des \textbf{exceptions soulevables} (fréquent,
p.ex. Java).

\bigskip

\itempoint Annotation de la \textbf{mutabilité} par le type.
P.ex. $\texttt{Nat}$ = type d'un entier (immuable) mais
$\texttt{Ref~Nat}$ = type d'une \alert{référence} vers un entier
(mutable).

\bigskip

\itempoint Annotation des \textbf{effets de bord} par le type.  P.ex.,
en Haskell, $\texttt{Char}$ = caractère = fonction de zéro argument
renvoyant un caractère (fonction pure : toujours le même retour), mais
$\texttt{IO~Char}$ = \alert{action} avec effets de bord renvoyant un
caractère ($\texttt{IO}$ est un constructeur de type appelé « monade »
I/O).

\bigskip

\itempoint Typage \textbf{linéaire} (forme de typage
« sous-structurel ») ou types à unicité : assure qu'une valeur est
utilisée \alert{une et une seule fois} dans un calcul (ni duplication
ni perte sauf manœuvre spéciale).

\smallskip

Permet d'optimiser la gestion de la mémoire (Rust) et/ou d'annoter les
effets de bord (Clean).

\end{frame}
%
\begin{frame}
\frametitle{Quelques exemples}

{\footnotesize Éviter les termes de typage « faible » et « fort », qui
  veulent tout (ou rien) dire.\par}

\medskip

\itempoint Assembleur (langage machine) : aucun typage (tout est
donnée binaire).

{\footnotesize Idem : machine de Turing, fonctions générales
  récursives (tout est entier), $\lambda$-calcul non typé (tout est
  fonction).\par}

\medskip

\itempoint C : annoté, vérifié à la compilation (\emph{aucune}
vérification à l'exécution), moyennement complexe et contournable
(pointeurs génériques \texttt{void*}).

\medskip

\itempoint Python, JavaScript, Perl, Scheme, etc. : typage vérifié à
l'exécution, superficiel.  Suffisant pour éviter les comportements
indéfinis.

\medskip

\itempoint Java : annoté, mixte compilation/exécution (double
vérification), initialement superficiel (listes non typées), puis
introduction de « génériques » ($\rightarrow$ polymorphisme
paramétrique) avec Java 5, puis diverses sortes d'inférence.

\medskip

\itempoint Rust : interaction avec la gestion de la mémoire
($\approx$ typage linéaire).

\medskip

\itempoint OCaml, Haskell : langages fonctionnels avec système de
typage très complexe (polymor\textsuperscript{sme} paramétrique, types
récursifs… ; Haskell : +polymor\textsuperscript{sme} ad hoc)

\end{frame}
%
\end{document}