1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
|
%% This is a LaTeX document. Hey, Emacs, -*- latex -*- , get it?
\documentclass[mathserif,a4paper,aspectratio=169]{beamer}
%\documentclass[a4paper]{article}
%\usepackage[envcountsect,noxcolor]{beamerarticle}
\usepackage[shorthands=off,french]{babel}
\usepackage[utf8]{inputenc}
\usepackage[T1]{fontenc}
\usepackage{lmodern}
\DeclareUnicodeCharacter{00A0}{~}
\DeclareUnicodeCharacter{2026}{...}
\DeclareUnicodeCharacter{1E25}{\d{h}}
% Beamer theme:
\usetheme{Goettingen}
%\usecolortheme{albatross}
%\usecolortheme{lily}
%\setbeamercovered{transparent}
% A tribute to the worthy AMS:
\usepackage{amsmath}
\usepackage{amsfonts}
\usepackage{amssymb}
\usepackage{amsthm}
%
\usepackage{mathrsfs}
%
\usepackage{graphicx}
\usepackage{tikz}
\usetikzlibrary{arrows,automata,calc}
%
\newcommand{\itempoint}{\strut\hbox{\color{beamerstructure}\donotcoloroutermaths$\blacktriangleright$}\nobreak\hskip.5em plus.5em\relax}
\renewcommand{\thefootnote}{\textdagger}
\newcommand{\dbllangle}{\mathopen{\langle\!\langle}}
\newcommand{\dblrangle}{\mathclose{\rangle\!\rangle}}
%
%
%
\title{Typage simple}
\subtitle{INF110 (Logique et Fondements de l'Informatique)}
\author[David Madore]{David A. Madore\\
{\footnotesize Télécom Paris}\\
\texttt{david.madore@enst.fr}}
\date{2023–2024}
\mode<presentation>{%
\beamertemplatenavigationsymbolsempty
\usenavigationsymbolstemplate{\vbox{\hbox{\footnotesize\hyperlinkslideprev{$\leftarrow$}\insertframenumber/\inserttotalframenumber\hyperlinkslidenext{$\rightarrow$}}}}
}
\setbeamercolor{myhighlight}{fg=black,bg=white!90!green}
\begin{document}
\mode<article>{\maketitle}
%
\setlength\abovedisplayskip{2pt plus 2pt minus 2pt}
\setlength\belowdisplayskip{2pt plus 2pt minus 2pt}
%
\begin{frame}
\titlepage
{\footnotesize\center{\url{http://perso.enst.fr/madore/inf110/transp-inf110.pdf}}\par}
{\tiny
\immediate\write18{sh ./vc > vcline.tex}
\begin{center}
Git: \input{vcline.tex}
\end{center}
\immediate\write18{echo ' (stale)' >> vcline.tex}
\par}
\end{frame}
%
\section*{Plan}
\begin{frame}
\frametitle{Plan}
\tableofcontents
\end{frame}
%
\section{Généralités sur le typage}
\begin{frame}
\frametitle{Qu'est-ce que le typage ?}
{\footnotesize Philosophie opposée du « codage de Gödel » en
calculabilité, lequel représente toute donnée finie par un
entier.\par}
\medskip
\itempoint Informellement, un \textbf{système de typage} est une façon
d'affecter à toute \alert{expression} et/ou \alert{valeur} manipulée
par un langage informatique un \textbf{type} qui contraint son usage
{\footnotesize (p.ex., « entier », « fonction », « chaîne de
caractères »)}.
\medskip
\textbf{Buts :}
\begin{itemize}
\item attraper plus tôt des \textbf{erreurs de programmation}
{\footnotesize (« ajouter un entier et une chaîne de caractères »
est probablement une erreur, ou demande une conversion
explicite)},
\item éviter des \textbf{plantages ou problèmes de sécurité}
{\footnotesize (exécution d'un entier)},
\item garantir certaines \textbf{propriétés du comportement} des
programmes ($\rightarrow$ analyse statique), forcément de façon
limitée (cf. théorème de Rice), p.ex., la \alert{terminaison},
\item aider à l'\textbf{optimisation} {\footnotesize (fonction pure :
sans effet de bord)}.
\end{itemize}
\medskip
{\footnotesize Cf. systèmes d'unités (homogénéité) en physique.\par}
\end{frame}
%
\begin{frame}
\frametitle{Variétés de typage}
Il y a autant de systèmes de typage que de langages de programmation !
\medskip
\itempoint Typage \textbf{statique} (à compilation) vs
\textbf{dynamique} (à exécution) ou mixte.
{\footnotesize En général on préfère : erreur à la compilation $>$
erreur à l'exécution $>$ plantage.\par}
\medskip
\itempoint Typage \textbf{inféré} par le langage ou \textbf{annoté}
par le programmeur.
{\footnotesize Type = promesse donnée par le langage au
programmeur ou par le programmeur au langage ?\par}
\medskip
\itempoint Typage « sûr » ou partiel/contournable (\textit{cast} de
la valeur, manipulation de la représentation mémoire, suppression ou
report à l'exécution de vérification).
\medskip
\itempoint Typage superficiel {\footnotesize (« ceci est une liste »)}
ou complexe {\footnotesize (« ceci est une liste d'entiers »)}.
\medskip
\itempoint Diverses annotations possibles {\footnotesize (« cette
fonction est pure », « soulève une exception »)}.
\medskip
\itempoint Liens avec les mécanismes de sécurité (qui peut faire
quoi ?), de gestion de la mémoire (système de typage linéaire),
l'évaluation (exceptions), la mutabilité.
\medskip
\itempoint Les types sont-ils citoyens de première classe
{\footnotesize (:= manipulables dans le langage)} ?
{\footnotesize Juvénal : « Quis custodiet ipsos custodes? » Quel est
le type des types eux-mêmes ?\par}
\end{frame}
%
\begin{frame}
\frametitle{Opérations de base sur les types}
En plus de types de base (p.ex. $\texttt{Nat}$ = entiers,
$\texttt{Bool}$ = booléens), les opérations suivantes sur les types
sont \emph{souvent} proposées par les systèmes de typage :
\bigskip
\itempoint Types \textbf{produits} (= paires, triplets, $k$-uplets).
P.ex. $\texttt{Nat} \times \texttt{Bool}$ = type des paires formées
d'un entier et d'un booléen.
\smallskip
Composantes éventuellement nommées $\rightarrow$ structures
(= enregistrements).
\smallskip
Produit vide = type trivial, $\texttt{Unit}$ (une seule valeur).
\bigskip
\itempoint Types \textbf{sommes} (= unions). P.ex. $\texttt{Nat} +
\texttt{Bool}$ = type pouvant contenir un entier \emph{ou} un booléen,
avec un \alert{sélecteur} de cas.
\smallskip
Cas particulier : $\texttt{Unit} + \cdots + \texttt{Unit}$ = type
« énumération » (pur sélecteur).
\smallskip
Somme vide = type inhabité (impossible : aucune valeur).
\bigskip
\itempoint Types \textbf{fonctions} (= exponentielles).
P.ex. $\texttt{Nat} \rightarrow \texttt{Bool}$.
\bigskip
\itempoint Types \textbf{listes}. P.ex. $\texttt{List}~\texttt{Nat}$
= type des listes d'entiers.
\end{frame}
%
\begin{frame}
\frametitle{Quelques fonctionnalités fréquentes}
\itempoint \textbf{Sous-typage} = les valeurs d'un type sont
automatiquement des valeurs possibles d'un autre.
\bigskip
\itempoint \textbf{Polymorphisme} = utilisation de plusieurs types
possibles, voire de n'importe quel type (cf. transp. suivant).
P.ex. la fonction « identité » $(\forall\mathtt{t})\; \mathtt{t}
\rightarrow \mathtt{t}$.
\bigskip
\itempoint \textbf{Constructeurs de types} = fabriquent un type à
partir d'un (ou plusieurs) autres. P.ex. $\texttt{List}$ (fabrique le
type « liste de $\mathtt{t}$ » à partir de $\mathtt{t}$).
\bigskip
\itempoint \textbf{Types récursifs} = construits par les opérateurs
(produits, sommes, fonctions, constructeurs…) à partir des types
définis eux-mêmes. P.ex. $\texttt{Tree} =
\texttt{List}~\texttt{Tree}$.
\bigskip
\itempoint \textbf{Types dépendants} = un type à partir d'une valeur.
P.ex. $k \mapsto \texttt{Nat}^k$.
\bigskip
\itempoint \textbf{Types opaques} (abstraits, privés…) = types dont
les valeurs sont cachées, l'usage est limité à une interface publique.
\end{frame}
%
\begin{frame}
\frametitle{Polymorphisme}
On distingue deux (trois ?) sortes de polymorphismes :
\medskip
\itempoint Polymorphisme \textbf{paramétrique} (ou « génériques ») :
la même fonction \alert{s'applique à l'identique} à une donnée de
n'importe quel type.
\smallskip
Exemples :
\begin{itemize}
\item $\texttt{head} : (\forall\mathtt{t})\; \texttt{List}~\mathtt{t} \to \mathtt{t}$ (renvoie le premier élément d'une liste)
\item $\lambda xy.\langle x,y\rangle :
(\forall\mathtt{u},\mathtt{v})\; \mathtt{u} \to \mathtt{v} \to
\mathtt{u}\times \mathtt{v}$ (fabrique un couple)
\item $\lambda xyz.xz(yz) :
(\forall\mathtt{u},\mathtt{v},\mathtt{w})\; (\mathtt{u} \to
\mathtt{v} \to \mathtt{w}) \to (\mathtt{u} \to
\mathtt{v}) \to \mathtt{u} \to
\mathtt{w}$
\end{itemize}
\smallskip
Pas seulement pour les fonctions ! $\texttt{[]} :
(\forall\mathtt{t})\; \texttt{List}~\mathtt{t}$ (liste vide)
\smallskip
{\footnotesize Et même : $\texttt{while~true~do~pass~done} :
(\forall\mathtt{t})\; \mathtt{t}$ (boule infinie)\par}
\bigskip
\itempoint Polymorphisme \textbf{ad hoc} (ou « surcharge » /
« \textit{overloading} ») : la fonction \alert{agit différemment} en
fonction du type de son argument (connu à la compilation !).
\bigskip
{\footnotesize Le sous-typage est parfois considéré comme une forme de
polymorphisme, voire la coercion (\textit{cast}). Les limites de
ces notions sont floues.\par}
\end{frame}
%
\begin{frame}
\frametitle{Tâches d'un système de typage}
\itempoint \textbf{Vérification} de type : vérifier qu'une expression
\emph{annotée} a bien le type prétendu par les annotations.
\bigskip
\itempoint \textbf{Inférence} (« reconstruction » / « assignation »)
de type : calculer le type de l'expression \alert{en l'absence
d'annotations} (ou avec annotations partielles).
\medskip
Algorithme important : \textbf{Hindley-Milner} (inférence de type dans
les langages fonctionnels à polymorphisme paramétrique). Utilisé
dans OCaml, Haskell, etc.
\medskip
\textbf{N.B.} Dans un système de typage trop complexe, l'inférence
(voire la vérification !) \textcolor{orange}{peut devenir indécidable}
(notamment si types de première classe / dépendant de valeurs
arbitraires à l'exécution).
\bigskip
{\footnotesize Rarement utile en informatique mais essentiel en
logique ($\cong$ recherche de preuves) :\par}
\itempoint \textbf{Habitation} de type : trouver un \alert{terme}
(=expression) ayant un type donné.
{\footnotesize P.ex. : y a-t-il un terme de type
$(\forall\mathtt{p},\mathtt{q})\; ((\mathtt{p} \to \mathtt{q}) \to
\mathtt{p}) \to \mathtt{p}$ ?\par}
{\footnotesize \textbf{N.B.} Dans les langages usuels, \alert{tous}
les types sont habités par une boucle infinie (« \texttt{while true
do pass done} » ou « \texttt{let rec f () = f () in f ()} »),
\alert{même} le type vide.\par}
\end{frame}
%
\begin{frame}
\frametitle{Utilisations du typage au-delà des valeurs stockées}
\itempoint Annotation des \textbf{exceptions soulevables} (fréquent,
p.ex. Java).
\bigskip
\itempoint Annotation de la \textbf{mutabilité} par le type.
P.ex. $\texttt{Nat}$ = type d'un entier (immuable) mais
$\texttt{Ref~Nat}$ = type d'une \alert{référence} vers un entier
(mutable).
\bigskip
\itempoint Annotation des \textbf{effets de bord} par le type. P.ex.,
en Haskell, $\texttt{Char}$ = caractère = fonction de zéro argument
renvoyant un caractère (fonction pure : toujours le même retour), mais
$\texttt{IO~Char}$ = \alert{action} avec effets de bord renvoyant un
caractère ($\texttt{IO}$ est un constructeur de type appelé « monade »
I/O).
\bigskip
\itempoint Typage \textbf{linéaire} (forme de typage
« sous-structurel ») ou types à unicité : assure qu'une valeur est
utilisée \alert{une et une seule fois} dans un calcul (ni duplication
ni perte sauf manœuvre spéciale).
\smallskip
Permet d'optimiser la gestion de la mémoire (Rust) et/ou d'annoter les
effets de bord (Clean).
\end{frame}
%
\begin{frame}
\frametitle{Quelques exemples (1)}
Les langages impératifs \emph{tendent} à avoir des systèmes de typage
moins complexes que les langages fonctionnels.
\medskip
{\footnotesize Éviter les termes de typage « faible » et « fort », qui
veulent tout (ou rien) dire.\par}
\medskip
\itempoint Assembleur (langage machine) : aucun typage (tout est
donnée binaire).
{\footnotesize Idem : machine de Turing, fonctions générales
récursives (tout est entier), $\lambda$-calcul non typé (tout est
fonction).\par}
\medskip
\itempoint C : annoté, vérifié à la compilation (\emph{aucune}
vérification à l'exécution), moyennement complexe et contournable
(pointeurs génériques \texttt{void*}).
\medskip
\itempoint Python, JavaScript, Perl, Scheme, etc. : typage vérifié à
l'exécution, superficiel. Suffisant pour éviter les comportements
indéfinis.
\medskip
\itempoint Java : annoté, mixte compilation/exécution (double
vérification), initialement superficiel (listes non typées), puis
introduction de « génériques » ($\rightarrow$ polymorphisme
paramétrique) avec Java 5, puis diverses sortes d'inférence.
\medskip
\itempoint Rust : interaction avec la gestion de la mémoire
($\approx$ typage linéaire).
\end{frame}
%
\begin{frame}
\frametitle{Quelques exemples (2)}
{\footnotesize Qqs exemples de langages, généralement fonctionnels,
ayant un système de typage (très) complexe, mélangeant plusieurs
fonctionnalités évoquées (interactions parfois délicates !) :\par}
\medskip
\itempoint OCaml : inférence de type à la H-M, types récursifs,
polymor\textsuperscript{sme} paramétrique.
\smallskip
Système de « modules » (« signatures » $\approx$ interfaces
abstraites, « foncteurs » entre signatures…), comparable aux
« classes » des langages orientés objet.
\medskip
\itempoint Haskell : beaucoup de similarité avec OCaml :
\smallskip
+ polymorphisme ad hoc : « classes de type », comparable aux
« modules » de OCaml, aux « classes » des langages orientés objet.
\smallskip
+ purement fonctionnel (toutes les fonctions sont « pures ») : les
effets de bord sont enrobés dans des « monades ».
\medskip
\itempoint Mercury (langage de type fonctionnel+logique, inspiré de
Haskell+Prolog) : typage comparable à Haskell ; + sous-typage,
linéarité.
\medskip
\itempoint Idris : langage fonctionnel + assistant de preuve.
\end{frame}
%
\end{document}
|