%% This is a LaTeX document. Hey, Emacs, -*- latex -*- , get it?
\documentclass[12pt,a4paper]{article}
\usepackage[francais]{babel}
\usepackage[utf8]{inputenc}
\usepackage[T1]{fontenc}
%\usepackage{ucs}
\usepackage{times}
% A tribute to the worthy AMS:
\usepackage{amsmath}
\usepackage{amsfonts}
\usepackage{amssymb}
\usepackage{amsthm}
%
\usepackage{mathrsfs}
\usepackage{wasysym}
\usepackage{url}
%
\usepackage{makeidx}
%% Self-note: compile index with:
%% xindy -M texindy -C utf8 -L french notes-accq205.idx
%
\usepackage{graphics}
\usepackage[usenames,dvipsnames]{xcolor}
\usepackage{tikz}
\usetikzlibrary{matrix}
\usepackage{hyperref}
%
\theoremstyle{definition}
\newtheorem{comcnt}{Tout}[subsection]
\newcommand\thingy{%
\refstepcounter{comcnt}\smallbreak\noindent\textbf{\thecomcnt.} }
\newtheorem{defn}[comcnt]{Définition}
\newtheorem{prop}[comcnt]{Proposition}
\newtheorem{lem}[comcnt]{Lemme}
\newtheorem{thm}[comcnt]{Théorème}
\newtheorem{cor}[comcnt]{Corollaire}
\newtheorem{scho}[comcnt]{Scholie}
\renewcommand{\qedsymbol}{\smiley}
%
\newcommand{\id}{\operatorname{id}}
\newcommand{\Frac}{\operatorname{Frac}}
\newcommand{\degtrans}{\operatorname{deg.tr}}
\newcommand{\Frob}{\operatorname{Frob}}
\newcommand{\alg}{\operatorname{alg}}
\newcommand{\sep}{\operatorname{sep}}
\newcommand{\Gal}{\operatorname{Gal}}
\newcommand{\Fix}{\operatorname{Fix}}
\newcommand{\Hom}{\operatorname{Hom}}
\newcommand{\Divis}{\operatorname{Div}}
\newcommand{\divis}{\operatorname{div}}
\newcommand{\Pic}{\operatorname{Pic}}
\newcommand{\ord}{\operatorname{ord}}
%
\DeclareUnicodeCharacter{00A0}{~}
%
\DeclareMathSymbol{\tiret}{\mathord}{operators}{"7C}
\DeclareMathSymbol{\traitdunion}{\mathord}{operators}{"2D}
%
\DeclareFontFamily{U}{manual}{}
\DeclareFontShape{U}{manual}{m}{n}{ <-> manfnt }{}
\newcommand{\manfntsymbol}[1]{%
{\fontencoding{U}\fontfamily{manual}\selectfont\symbol{#1}}}
\newcommand{\dbend}{\manfntsymbol{127}}% Z-shaped
\newcommand{\danger}{\noindent\hangindent\parindent\hangafter=-2%
\hbox to0pt{\hskip-\hangindent\dbend\hfill}}
%
\newcommand{\defin}[2][]{\def\latexsucks{#1}\ifx\latexsucks\empty\index{#2}\else\index{\latexsucks}\fi\textbf{#2}}
%
%
%
\makeindex
\begin{document}
\title{Courbes algébriques\\(notes provisoires)}
\author{David A. Madore}
\maketitle
\centerline{\textbf{ACCQ205}}
{\footnotesize
\immediate\write18{sh ./vc > vcline.tex}
\begin{center}
Git: \input{vcline.tex}
\end{center}
\immediate\write18{echo ' (stale)' >> vcline.tex}
\par}
\pretolerance=8000
\tolerance=50000
%
%
%
{\color{brown!70!black}\textbf{Version provisoire incomplète} de ces
notes (voir la ligne « Git » ci-dessus pour la date de dernière
modification). La numérotation \emph{devrait} ne pas changer, mais
ce n'est pas complètement exclu.}
{\footnotesize
\tableofcontents
\par}
\bigbreak
\section{Corps et extensions de corps}
\subsection{Anneaux, algèbres, corps, idéaux premiers et maximaux et corps des fractions}
\thingy Sauf précision expresse du contraire, tous les anneaux
considérés sont commutatifs et ont un élément unité (noté $1$). Il
existe un unique anneau dans lequel $0=1$, c'est l'anneau réduit à un
seul élément, appelé l'\defin[nul (anneau)]{anneau nul}. (Pour tout anneau $A$, il
existe un unique morphisme de $A$ vers l'anneau nul ; en revanche, il
n'existe un morphisme de l'anneau nul vers $A$ que si $A$ est lui-même
l'anneau nul.)
\thingy Si $k$ est un anneau, une \defin[algèbre]{$k$-algèbre} (là aussi :
implicitement commutative) est la donnée d'un morphisme d'anneaux $k
\buildrel\varphi_A\over\to A$ appelé \defin[structural (morphisme)]{morphisme structural} de
l'algèbre. On peut multiplier un élément de $A$ par un élément de $k$
avec : $c\cdot x = \varphi_A(c)\,x \in A$ (pour $c\in k$ et $x\in A$).
Un morphisme de $k$-algèbres est un morphisme d'anneaux
$A\buildrel\psi\over\to B$ tel que le morphisme structural $k
\buildrel\varphi_B\over\to B$ de $B$ soit la composée $k
\buildrel\varphi_A\over\to A\buildrel\psi\over\to B$ de celui de $A$
avec le morphisme considéré.
De façon équivalente, une $k$-algèbre est un $k$-module qui est muni
d'une multiplication $k$-bilinéaire qui en fait un anneau, et les
morphismes de $k$-algèbres sont les applications $k$-linéaires qui
préservent la multiplication ; le morphisme structural peut alors se
retrouver par $c \mapsto c\cdot 1$. Notons qu'une
$\mathbb{Z}$-algèbre est exactement la même chose qu'un anneau (raison
pour laquelle il est souvent préférable d'énoncer les résultats en
parlant de $k$-algèbres pour plus de généralité).
Dans la pratique, cependant $k$ sera généralement un corps : une
$k$-algèbre est donc un $k$-espace vectoriel muni d'une multiplication
$k$-bilinéaire qui en fait un anneau, et le morphisme structural est
automatiquement injectif si l'algèbre n'est pas l'algèbre nulle.
\thingy\label{regular-elements-and-prime-ideals}
Un élément $a$ d'un anneau $A$ (sous-entendu : commutatif) est
dit \defin[régulier (élément d'un anneau)]{régulier}, resp. \defin{inversible}, lorsque $x \mapsto
ax$ est injectif, resp. bijectif, autrement dit lorsque $ax = 0$
implique $x = 0$ (la réciproque est toujours vraie), resp. lorsqu'il
existe $x$ (appelé inverse de $a$) tel que $ax = 1$.
Un anneau dans $A$ dans lequel l'ensemble des éléments régulier est
égal à l'ensemble $A \setminus \{0\}$ des éléments non-nuls est appelé
anneau \defin[intègre (anneau)]{intègre} : autrement dit, un anneau intègre est un
anneau dans lequel ($0\neq 1$ et) $ab = 0$ implique $a=0$ ou $b=0$ (la
réciproque est toujours vraie). Par convention, l'anneau nul n'est
pas intègre.
Un idéal $\mathfrak{p}$ d'un anneau $A$ est dit \defin[premier (idéal)]{premier}
lorsque l'anneau quotient $A/\mathfrak{p}$ est un anneau intègre,
autrement dit lorsque $\mathfrak{p}\neq A$ et que $ab \in
\mathfrak{p}$ implique $a \in \mathfrak{p}$ ou $b \in \mathfrak{p}$
(la réciproque est toujours vraie).
\thingy\label{fields-and-maximal-ideals} Dans un anneau (toujours sous-entendu commutatif...),
l'ensemble noté $A^\times$ des éléments inversibles est un groupe,
aussi appelé groupe des \defin[unité (dans un anneau)]{unités} de $A$.
Un \defin{corps} est un anneau $k$ dans lequel l'ensemble $k^\times$
des éléments inversibles est égal à l'ensemble $k\setminus\{0\}$ des
éléments non-nuls : autrement dit, un corps est un anneau dans lequel
($0\neq 1$ et) tout élément non-nul est inversible. De façon
équivalente, un corps est un anneau ayant exactement deux idéaux (qui
sont alors $0$ et lui-même). Par convention, l'anneau nul n'est pas
un corps.
Un corps est, en particulier, un anneau intègre.
Un idéal $\mathfrak{m}$ d'un anneau $A$ est dit \defin[maximal (idéal)]{maximal}
lorsque l'anneau quotient $A/\mathfrak{m}$ est un corps : de façon
équivalente, lorsque $\mathfrak{m}\neq A$ et que $\mathfrak{m}$ est
maximal pour l'inclusion parmi les idéaux $\neq A$. Un idéal maximal
est, en particulier, premier.
\thingy\label{examples-prime-ideals}
À titre d'exemple, l'idéal $n\mathbb{Z}$ de $\mathbb{Z}$ (on
rappelle que tous les idéaux de $\mathbb{Z}$ sont de cette forme, pour
un $n \in \mathbb{N}$ défini de façon unique) est premier si et
seulement si $n = 0$ (le quotient étant $\mathbb{Z}$ lui-même) ou bien
$n$ est un nombre premier ; il est intègre exactement si $n$ est un
nombre premier (le quotient étant alors le corps
$\mathbb{Z}/n\mathbb{Z}$).
Pour donner un exemple moins évident, dans l'anneau $k[x,y]$ des
polynômes à deux indéterminées $x,y$ sur un corps $k$, l'idéal $(y)$
(des polynômes s'annulant identiquement sur l'axe des abscisses) est
premier mais non maximal puisque $k[x,y]/(y) \cong k[x]$, tandis que
l'idéal $(x,y)$ (des polynômes s'annulant à l'origine) est maximal
puisque $k[x,y]/(x,y) \cong k$.
Plus généralement, dans un anneau factoriel $A$, un idéal de la forme
$(f)$ avec $f \in A$, est premier si et seulement si $f$ est nul ou
irréductible (mais ce ne sont, en général, pas les seuls idéaux
premiers de $A$) ; comparer avec \ref{gauss-lemma-on-irreducibility}
plus bas.
\bigbreak
Le résultat ensembliste suivant sera admis :
\begin{lem}[principe maximal de Hausdorff]\label{hausdorff-maximal-principle}
Soit $\mathscr{F}$ un ensemble de parties d'un ensemble $A$. On
suppose que $\mathscr{F}$ est non vide et que pour toute partie non
vide $\mathscr{T}$ de $\mathscr{F}$ totalement ordonnée par
l'inclusion (c'est-à-dire telle que pour $I,I' \in \mathscr{T}$ on a
soit $I \subseteq I'$ soit $I \supseteq I'$) la réunion $\bigcup_{I
\in \mathscr{T}} I$ soit contenue dans un élément de $\mathscr{F}$.
Alors il existe dans $\mathscr{F}$ un élément $M$ maximal pour
l'inclusion (c'est-à-dire que si $I \supseteq M$ avec $I \in
\mathscr{F}$ alors $I=M$).
\end{lem}
\begin{prop}\label{existence-maximal-ideals}
Dans un anneau $A$, tout idéal strict (=autre que $A$) est inclus dans
un idéal maximal.
\end{prop}
\begin{proof}
Si $I$ est un idéal strict de $A$, on applique le principe maximal de
Hausdorff à $\mathscr{F}$ l'ensemble des idéaux stricts de $A$
contenant $I$. Si $\mathscr{T}$ est une chaîne (=partie totalement
ordonnée pour l'inclusion) de tels idéaux, la réunion $\bigcup_{I \in
\mathscr{T}} I$ en est encore un\footnote{La réunion de deux idéaux
n'est généralement pas un idéal, car si $x\in I$ et $x' \in I'$, la
somme $x+x'$ n'a pas de raison d'appartenir à $I\cup I'$. En
revanche, si $\mathscr{T}$ est une famille d'idéaux totalement
ordonnée par l'inclusion, alors $\bigcup_{I \in \mathscr{T}} I$ est
un idéal : si $x\in I$ et $x' \in I'$, où $I,I'\in \mathscr{T}$, on
peut écrire soit $I \subseteq I'$ soit $I'\subseteq I$, et dans un
cas comme dans l'autre on a $x+x' \in \bigcup_{I \in \mathscr{T}}
I$.} (pour voir que la réunion est encore un idéal strict, remarquer
que $1$ n'y appartient pas). Le principe maximal de Hausdorff permet
de conclure.
\end{proof}
\thingy\label{nilpotent-element-and-reduced-ring} Un élément $x$ d'un
anneau $A$ est dit \defin{nilpotent} lorsqu'il existe $n\geq 0$ tel
que $x^n = 0$ (un anneau dans lequel le seul élément nilpotent est $0$
est dit \defin[réduit (anneau)]{réduit}).
\begin{prop}\label{nilradical-facts}
Dans un anneau, l'ensemble des éléments nilpotents est un idéal :
cet idéal est aussi l'intersection des idéaux premiers de l'anneau.
(On l'appelle le \defin{nilradical} de l'anneau.)
Le quotient de l'anneau par son nilradical est réduit.
\end{prop}
\begin{proof}
L'ensemble des nilpotents est un idéal car si $x^n=0$ et $y^n=0$ alors
$(x+y)^{2n}=0$ en développant. Il est inclus dans tout idéal
premier $\mathfrak{p}$, car $x^n \in \mathfrak{p}$ (et à plus forte
raison $x^n = 0$) implique $x \in \mathfrak{p}$ par récurrence
sur $n$. Montrons que si $z$ est inclus dans tout idéal
premier, alors $z$ est nilpotent.
Supposons que $z$ n'est pas nilpotent. Considérons $\mathfrak{p}$ un
idéal maximal pour l'inclusion parmi les idéaux ne contenant aucun
$z^n$ : un tel idéal existe d'après le principe maximal de Hausdorff
(il existe un idéal ne contenant aucun $z^n$, à savoir $\{0\}$).
Montrons qu'il est premier : si $x,y \not \in \mathfrak{p}$, on veut
voir que $xy \not\in \mathfrak{p}$. Par maximalité de $\mathfrak{p}$,
chacun des idéaux\footnote{On rappelle que si $I,J$ sont deux idéaux
d'un anneau, l'ensemble $I + J = \{u+v : u\in I, v\in J\}$ est un
idéal, c'est l'idéal engendré par $I\cup J$, c'est-à-dire, le plus
petit idéal contenant $I$ et $J$ ; on l'appelle idéal somme de $I$
et $J$. Dans le cas particulier où $J = (x)$ est engendré par un
élément, c'est donc l'idéal engendré par $I\cup\{x\}$.}
$\mathfrak{p}+(x)$ et $\mathfrak{p}+(y)$ doit rencontrer $\{z^n\}$,
c'est-à-dire qu'on doit pouvoir trouver deux éléments de la forme
$f+ax$ et $g+by$ avec $f,g\in\mathfrak{p}$ et $a,b\in A$, qui soient
des puissances de $z$ ; leur produit est alors aussi une puissance
de $z$, donc n'est pas dans $\mathfrak{p}$, donc $abxy
\not\in\mathfrak{p}$ (car les trois autres termes sont
dans $\mathfrak{p}$), et a plus forte raison $xy \not\in
\mathfrak{p}$.
Enfin, dire que le quotient de $A$ par son nilradical est réduit
signifie exactement que si une puissance d'un élément est nilpotente
alors cet élément lui-même est nilpotent, ce qui est évident.
\end{proof}
\thingy\label{definition-fraction-field}
Si $A$ est un anneau intègre, on définit un corps $\Frac(A)$,
dit \index{fractions (corps des)}\defin{corps des fractions} de $A$, dont les éléments sont les
symboles formels $\frac{a}{q}$ avec $a \in A$ et $q \in A
\setminus\{0\}$, en convenant d'identifier $\frac{a}{q}$ avec
$\frac{a'}{q'}$ lorsque $aq' = a'q$ (i.e., formellement, $\Frac(A)$
est le quotient de $A \times (A\setminus\{0\})$ par la relation
d'équivalence qu'on vient de dire) ; la structure d'anneau est définie
par $\frac{a}{q} + \frac{a'}{q'} = \frac{aq'+a'q}{qq'}$ et
$\frac{a}{q} \cdot \frac{a'}{q'} = \frac{aa'}{qq'}$. On a aussi un
morphisme injectif $A \to \Frac(A)$ envoyant $a$ sur $\frac{a}{1}$, et
on identifiera $A$ à son image par ce morphisme.
À titre d'exemple, $\Frac(\mathbb{Z})$ est $\mathbb{Q}$ (c'est même la
définition de ce dernier).
\thingy\label{universal-property-of-fraction-field} Le corps des
fractions d'un anneau intègre $A$ vérifie la propriété « universelle »
suivante : si $K$ est un corps quelconque, et $\varphi\colon A \to K$
un morphisme d'anneaux injectif, il existe un unique morphisme de
corps $\hat\varphi\colon \Frac(A) \to K$ (i.e., extension de corps,
cf. ci-dessous) qui prolonge $\varphi$ (i.e., $\hat\varphi(a) =
\varphi(a)$ si $a\in A$). En effet, il suffit de définir
$\hat\varphi(\frac{a}{q})$ par $\varphi(a)/\varphi(q)$.
Ainsi, $\Frac(A)$ est \emph{engendré en tant que corps} par les
éléments de $A$ (comparer \ref{subfield-generated}).
\thingy Le corps des fractions de l'anneau $k[t_1,\ldots,t_n]$ des
polynômes en $n$ indéterminées $t_1,\ldots,t_n$ sur un corps $k$ est
appelé corps des \defin{fractions rationnelles} (ou parfois
« fonctions rationnelles ») en $n$ indéterminées $t_1,\ldots,t_n$
sur $k$, et noté $k(t_1,\ldots,t_n)$.
\thingy\label{finite-integral-algebra-is-a-field} Le fait suivant sera
important : si $k$ est un corps et $K$ une $k$-algèbre \emph{de
dimension finie} intègre, alors $K$ est, en fait, un corps. En
effet, une application $k$-linéaire $K \to K$ injective est
automatiquement bijective, et en appliquant ce fait à la
multiplication par un $a\in K$, on voit que tout élément régulier est
inversible.
\thingy\label{gauss-lemma-on-irreducibility} Rappelons par ailleurs le
\defin[Gauß (lemme de)]{lemme de Gauß} concernant les polynômes irréductibles : si $A$
est un anneau factoriel et $K$ son corps des fractions, alors l'anneau
$A[t]$ des polynômes en une indéterminée sur $A$ est factoriel ; et
par ailleurs $f \in A[t]$ est irréductible (dans $A[t]$) si et
seulement si $f$ est constant et irréductible dans $A$, \emph{ou bien}
$f$ est irréductible \underline{dans $K[t]$} et le pgcd (dans $A$) des
coefficients de $f$ vaut $1$ (on dit que $f$ est \defin[primitif (polynôme)]{primitif}
lorsque cette dernière condition est vériifée). Le point-clé dans la
démonstration est de montrer que le pgcd $c(f)$ des coefficients d'un
polynôme dans $A[t]$, aussi appelé \defin{contenu} de $f$, est
multiplicatif (i.e., $c(fg) = c(f)\,c(g)$) ; la décomposition en
facteurs irréductibles dans $A[t]$ d'un élément de $A[t]$ s'obtient
alors à partir de celle de $K[t]$ et de celle dans $A$ du contenu.
Notamment, le corps $k[z_1,\ldots,z_n]$ des fractions rationnelles en
$n$ indéterminées sur un corps $k$ est un anneau factoriel, un
polynôme $f \in k[z_1,\ldots,z_n,t]$ (en $n+1$ indéterminées)
irréductible et faisant effectivement intervenir $t$ est encore
irréductible dans $k(z_1,\ldots,z_n)[t]$, et réciproquement, un
polynôme irréductible dans $k(z_1,\ldots,z_n)[t]$ donne un polynôme
irréductible dans $k[z_1,\ldots,z_n,t]$ quitte à multiplier par le
pgcd des dénominateurs.
\subsection{Algèbre engendrée, extensions de corps}
\thingy\label{subalgebra-generated} Si $A$ est une $k$-algèbre (où $k$
est un anneau), et
$(x_i)_{i\in I}$ est une famille d'éléments de $A$, l'intersection de
toutes les sous-$k$-algèbres de $A$ contenant les $x_i$ est encore une
sous-$k$-algèbre de $A$ contenant les $x_i$, c'est-à-dire que c'est la
plus petite sous-$k$-algèbre de $A$ contenant les $x_i$. On l'appelle
$k$-algèbre \defin[engendrée (algèbre)]{engendrée} (dans $A$) par les $x_i$ et on la note
$k[x_i]_{i\in I}$. Lorsque les $x_i$ sont en nombre fini (le cas qui
nous intéressera le plus), disons indicés par $1,\ldots,n$, on note
$k[x_1,\ldots,x_n]$, et on dit que $k[x_1,\ldots,x_n]$ est une
$k$-algèbre \defin[type fini (algèbre)]{de type fini} (en tant que $k$-\emph{algèbre}).
\danger On prendra garde au fait que la même notation
$k[x_1,\ldots,x_n]$ peut désigner soit la $k$-algèbre engendrée
par $x_1,\ldots,x_n$ dans une $k$-algèbre $A$ plus grande, soit
l'anneau des polynômes à $n$ indéterminées $x_1,\ldots,x_n$ sur $k$.
Ces conventions sont cependant cohérentes en ce sens que l'anneau des
polynômes à $n$ indéterminées sur $k$ est bien la $k$-algèbre
engendrée par les indéterminées (cf. le point suivant). Il faut donc
prendre garde à ce que sont $x_1,\ldots,x_n$ quand cette notation
apparaît : si aucune remarque n'est faite et que les $x_i$ n'ont pas
été introduits auparavant, il est généralement sous-entendu que ce
sont des indéterminées.
\thingy\label{subalgebra-generated-is-polynomials} La $k$-algèbre
engendrée par les $x_i$ dans $A$ peut encore se décrire concrètement
comme l'ensemble de tous les éléments de $A$ qui peuvent être obtenus
à partir de $1$ et des $x_i$ par sommes, produits par éléments de $k$
et produits binaires. Autrement dit, ce sont les valeurs des
polynômes à coefficients dans $k$ évalués en des $x_i$. Pour dire les
choses de façon plus sophistiquée, en supposant les $x_i$ en nombre
fini pour simplifier (et indicés par $1,\ldots,n$), il existe un
unique morphisme $k[t_1,\ldots,t_n] \to A$ envoyant $t_i$ sur $x_i$, à
savoir le \index{évaluation}morphisme « d'évaluation » qui à un $P \in
k[t_1,\ldots,t_n]$ associe $P(x_1,\ldots,x_n)$, et $k[x_1,\ldots,x_n]$
est l'\emph{image} de ce morphisme. On peut donc dire qu'une
$k$-algèbre de type fini $k[x_1,\ldots,x_n]$ est la même chose qu'un
\emph{quotient} de l'algèbre de polynômes $k[t_1,\ldots,t_n]$ (par le
noyau du morphisme d'évaluation).
Pour ce qui est du cas infini : la $k$-algèbre $k[x_i]_{i\in I}$
engendrée par une famille quelconque $(x_i)_{i\in I}$ d'éléments de
$A$ est la \emph{réunion} des algèbres $k[x_i]_{i\in J}$ engendrées
par toutes les sous-familles finies (i.e., $J\subseteq I$ fini) de la
famille donnée. (Autrement dit, $y \in A$ appartient à $k[x_i]_{i\in
I}$ si et seulement si il existe $J\subseteq I$ fini tel que $y$
appartienne à $k[x_i]_{i\in J}$.)
\danger Attention : une sous-algèbre d'une algèbre de type fini n'est
pas, en général, de type fini. Un contre-exemple est fourni par
l'anneau des polynômes $f \in k[x,y]$ à deux indéterminées sur un
corps $k$ qui prennent une valeur constante sur l'axe des ordonnées :
cette $k$-algèbre est engendrée par $1, x, xy, xy^2, xy^3,\ldots$ et
on peut montrer qu'aucun nombre fini de ses éléments ne suffit à
l'engendrer.
\thingy Une \defin{extension de corps} est un morphisme d'anneaux $k
\to K$ entre corps (c'est-à-dire que $K$ est une $k$-algèbre qui est
un corps). Un tel morphisme est automatiquement injectif (car son
noyau est un idéal d'un corps qui ne contient pas $1$), et qui peut
donc être considéré comme une inclusion : on notera soit $k \subseteq
K$ soit $K/k$ une telle extension ; lorsque l'inclusion a été fixée,
on dit aussi que $k$ est un \defin{sous-corps} de $K$. Un
\defin[intermédiaire (corps)]{corps intermédiaire} à une extension $k \subseteq K$, ou
encore \defin{sous-extension}, est, naturellement, une extension de
corps $k \subseteq E$ contenue dans $K$ ; on dit aussi que $k
\subseteq E \subseteq K$ est une \defin[tour d'extensions]{tour} d'extensions (et de
même pour n'importe quel nombre de corps intermédiaires).
\thingy\label{subfield-generated} Si $k \subseteq K$ est une extension
de corps, et $(x_i)_{i\in I}$ est une famille d'éléments de $K$,
l'intersection de tous les sous-corps de $K$ contenant $k$ et
les $x_i$ est encore un sous-corps de $K$ contenant $k$ et les $x_i$,
c'est-à-dire que c'est le plus petit corps intermédiaire contenant
les $x_i$. On l'appelle sous-extension \defin[engendrée (sous-extension)]{engendrée} (dans $K$)
par les $x_i$ et on la note $k(x_i)_{i\in I}$. Lorsque les $x_i$ sont
en nombre fini (le cas qui nous intéressera le plus), disons indicés
par $1,\ldots,n$, on note $k(x_1,\ldots,x_n)$, et on dit que
$k(x_1,\ldots,x_n)$ est une extension de $k$ \defin[type fini (extension de corps)]{de type fini}
(en tant qu'extension de \emph{corps}).
\danger On prendra garde au fait que la même notation
$k(x_1,\ldots,x_n)$ peut désigner soit la sous-extension engendrée
par $x_1,\ldots,x_n$ dans une extension $K$ plus grande, soit le corps
des fractions rationnelles à $n$ indéterminées $x_1,\ldots,x_n$
sur $k$. Ces conventions sont cependant cohérentes en ce sens que le
corps des fractions rationnelles à $n$ indéterminées sur $k$ est bien
la sous-extension engendrée par les indéterminées (cf. le point
suivant). Comme dans le cas de la $k$-algèbre engendrée, il faut donc
prendre garde à ce que sont $x_1,\ldots,x_n$ quand cette notation
apparaît : si aucune remarque n'est faite et que les $x_i$ n'ont pas
été introduits auparavant, il est généralement sous-entendu que ce
sont des indéterminées.
\thingy\label{subfield-generated-is-quotients} La sous-extension
engendrée (au-dessus de $k$) par les $x_i$ dans $K$ peut encore se
décrire concrètement comme l'ensemble de tous les éléments de $A$ qui
peuvent être obtenus à partir des éléments de $k$ et des $x_i$ par
sommes, produits et inverses (d'éléments non nuls). Autrement dit, ce
sont les valeurs des fractions rationnelles à coefficients dans $k$
évalués en des $x_i$ (à condition d'être bien définies).
Pour ce qui est du cas infini : la sous-extension $k(x_i)_{i\in I}$
engendrée par une famille quelconque $(x_i)_{i\in I}$ d'éléments de
$K$ est la \emph{réunion} des sous-extensions $k(x_i)_{i\in J}$
engendrées par toutes les sous-familles finies (i.e., $J\subseteq I$
fini) de la famille donnée. (Autrement dit, $y \in K$ appartient à
$k(x_i)_{i\in I}$ si et selement si il existe $J\subseteq I$ fini tel
que $y$ appartienne à $k(x_i)_{i\in J}$.)
Contrairement au cas des algèbres
(cf. \ref{subalgebra-generated-is-polynomials}), il \emph{est} bien
vrai qu'une sous-extension d'une extension de corps de type fini est
de type fini. Mais ce n'est pas évident ! (Cela sera démontré en
\ref{subextension-of-finite-type-is-of-finite-type} ci-dessous.)
\subsection{Extensions algébriques et degré}
\thingy\label{monogeneous-extensions-dichotomy} Si $k \subseteq K$ est
une extension de corps et $x\in K$, on a noté
(cf. \ref{subfield-generated}) $k(x)$ l'extension de $k$ engendrée
par $x$. On dira aussi que $k \subseteq k(x)$ est une extension
\defin[monogène (extension)]{monogène} (certains auteurs utilisent « simple », notamment en
anglais).
On se pose la question de mieux comprendre cette extension. Pour
cela, on introduit l'unique morphisme $\varphi\colon k[t] \to K$, où
$k[t]$ est l'anneau des polynômes en une indéterminée $t$ sur $k$, qui
envoie $t$ sur $x$, c'est-à-dire, le \index{évaluation}morphisme « d'évaluation »
envoyant $P$ sur $P(x)$ pour chaque $P \in k[t]$. Le noyau de
$\varphi$ est un idéal de $k[t]$. Exactement l'un des deux cas
suivants se produit :
\begin{itemize}
\item Soit $\varphi$ est injectif (=son noyau est nul), auquel cas on
dit que $x$ est \defin{transcendant} sur $k$. Dans ce cas, d'après
la propriété universelle du corps des fractions
(cf. \ref{universal-property-of-fraction-field}), $\varphi$ se
prolonge de manière unique en une extension de corps $k(t) \to K$
(où $k(t)$ est le corps des fractions rationnelles en l'indéterminée
$t$ sur $k$), envoyant $P/Q \in k(t)$ sur $P(x)/Q(x) \in K$, et
l'image de $k(t)$ dans $K$ est précisément $k(x)$
(cf. \ref{subfield-generated-is-quotients}). Ceci permet
d'identifier $k(x)$ avec le corps des fractions rationnelles en une
indéterminée (i.e., de considérer $x$ comme une indéterminée).
\item Soit le noyau de $\varphi$ est engendré par un unique polynôme
unitaire $\mu_x\in k[t]$, qu'on appelle le \defin{polynôme minimal}
de $x$, et alors $x$ est dit \defin[algébrique
(élément)]{algébrique} (ou \defin[entier algébrique
(élément)]{entier [algébrique]})\footnote{Les termes « algébrique »
et « entier [algébrique] » sont synonymes au-dessus d'un corps
puisque tout polynôme peut être rendu unitaire en divisant par le
coefficient dominant ; sur un anneau, la notion d'élément entier
[algébrique] se comporte généralement mieux.} sur $k$.
Alors l'image $k[x]$ de $\varphi$
(cf. \ref{subalgebra-generated-is-polynomials}) s'identifie à
$k[t]/(\mu_x)$, une $k$-algèbre de dimension $\deg\mu_x$ finie
sur $k$, qu'on appelle le \defin[degré (d'un élément)]{degré} de $x$ ; mais comme $k[x]$
est intègre (puisque c'est une sous-algèbre d'un corps), et de
dimension finie, c'est un corps
(cf. \ref{finite-integral-algebra-is-a-field}) : on a donc $k(x) =
k[x] = k[t]/(\mu_x)$ dans cette situation. De plus, le polynôme
$\mu_x$ est irréductible dans $k[t]$ (sans quoi on aurait deux
éléments dont le produit est nul dans $K$).
\end{itemize}
On remarquera que les éléments de $k$ eux-mêmes sont exactement les
algébriques de degré $1$ sur $k$. On remarquera aussi que si $k
\subseteq k' \subseteq K$, alors le polynôme minimal d'un $x\in K$
sur $k'$ divise celui sur $k$ (car ce dernier annule $x$ et est à
coefficients dans $k$ donc dans $k'$).
\thingy\label{monogeneous-extensions-dichotomy-bis} La dichotomie
décrite ci-dessus admet une sorte de réciproque : d'une part, si $t$
est une indéterminée, alors dans $k(t)$ (le corps des fractions
rationnelles) l'élément $t$ est bien transcendant sur $k$ (en fait,
toute fraction rationnelle non constante est transcendante sur $k$) ;
d'autre part, si $\mu$ est un polynôme unitaire irréductible sur $k$,
alors $k[t]/(\mu)$ est une $k$-algèbre de dimension finie intègre donc
(cf. \ref{finite-integral-algebra-is-a-field}) une extension de corps
de $k$ dans laquelle la classe $x := \bar t$ de l'indéterminée $t$ est
algébrique de polynôme minimal $\mu$ : ce corps $k(x) = k[t]/(\mu)$
est appelé \index{rupture (corps de)}\defin{corps de rupture} du polynôme irréductible $\mu$
sur $k$ (lorsque $\mu$ n'est pas unitaire, on peut encore parler de
corps de rupture quitte à diviser par le coefficient dominant ; en
revanche, l'irréductibilité est essentielle), et il va de soi que le
corps de rupture coïncide avec $k$ si et seulement si $\mu$ est de
degré $1$ (précisément, si $\mu = t-a$ alors l'élément $x := \bar t$
de $k(x) = k[t]/(\mu)$ s'identifie avec $a \in k$).
\thingy Une extension de corps $k\subseteq K$ est dite
\defin[algébrique (extension)]{algébrique} lorsque chaque élément de $K$ est algébrique
sur $k$. On dit aussi que $K$ est algébrique « au-dessus de » $k$ ou
« sur » $k$.
Un corps $k$ est dit \defin[algébriquement clos (corps)]{algébriquement clos} lorsque la seule
extension algébrique de $k$ est $k$ lui-même : d'après les remarques
précédentes, cela revient à dire que les seuls polynômes unitaires
irréductibles dans $k[t]$ sont les $t-a$.
À titre d'exemple, le corps $\mathbb{C}$ des nombres complexes est
algébriquement clos (« théorème de D'Alembert-Gauß »).
\thingy\label{degree-and-finite-extensions} Si $k\subseteq K$ est une
extension de corps, on peut considérer $K$ comme un $k$-espace
vectoriel, et sa dimension (finie ou infinie) est notée $[K:k]$ et
appelée \defin[degré (d'une extension)]{degré} de l'extension. Une extension de degré fini
est aussi dite \defin[finie (extension)]{finie} (ainsi, on pourra dire simplement que
$K$ est « fini sur $k$ » pour dire que son degré est fini). Il va de
soi qu'une sous-extension d'une extension finie est encore finie.
Il résulte de l'identification de $k(x)$ à $k[t]/(\mu_x)$ que, si $x$
est un élément algébrique sur $k$, alors $[k(x):k]$ est fini et égal
au degré $\deg\mu_x =: \deg(x)$ de $x$. \textit{A contrario}, si $x$
est transcendant, alors $[k(x):k]$ est infini. En particulier, on a
montré que : \emph{l'extension monogène $k\subseteq k(x)$ est finie si
et seulement si $x$ est algébrique sur $k$}.
\thingy\label{remark-multiplicativity-of-degree} On aura également
besoin du fait que si $k \subseteq K \subseteq L$ sont deux extensions
imbriquées alors $[L:k] = [K:k] \, [L:K]$ (au sens où le membre de
gauche est fini si et seulement si les deux facteurs du membre de
droite le sont, et dans ce cas leur produit lui est égal). Cela
résulte du fait plus précis que si $(x_i)_{i\in I}$ est une $k$-base
de $K$ et $(y_j)_{j\in J}$ une $K$-base de $L$, alors $(x_i
y_j)_{(i,j)\in I\times J}$ est une $k$-base de $L$ (vérification
aisée).
\thingy\label{basic-facts-algebraic-extensions} Les faits suivants sont à noter :
(1) Une extension de corps engendrée par un nombre fini d'éléments
algébriques est finie (en effet, si $x_1,\ldots,x_n$ sont algébriques
sur $k$, alors chaque extension $k(x_1,\ldots,x_{i-1}) \subseteq
k(x_1,\ldots,x_i)$ est monogène algébrique, donc finie, donc leur
composée est finie).
(1bis) En fait, sous ces conditions, on peut être un peu plus précis :
$k(x_1,\ldots,x_n)$ a une base comme $k$-espace vectoriel formée de
monômes en les $x_1,\ldots,x_n$ (c'est-à-dire d'expressions de la
forme $x_1^{r_1}\cdots x_n^{r_n}$). Ceci découle de la description de
la base donnée en \ref{remark-multiplicativity-of-degree} appliquée au
fait que chaque $k(x_1,\ldots,x_i)$ a une base sur
$k(x_1,\ldots,x_{i-1})$ formée des puissances de $x_i$ (jusqu'au degré
de celui-ci exclu).
(2) Une extension $k\subseteq K$ est finie si et seulement si elle est
à la fois algébrique et de type fini. (Le sens « si » résulte de
l'affirmation (1) ; pour le sens « seulement si », remarquer que pour
tout $x\in K$, l'extension $k\subseteq k(x)$ est finie donc
algébrique, et qu'une base de $K$ comme $k$-espace vectoriel engendre
certainement $K$ comme extension de corps de $k$.)
(3) Une extension de corps engendrée par une famille quelconque
d'éléments algébriques est algébrique (en effet, si $K = k(x_i)_{i\in
I}$ et $y \in K$, alors, cf. \ref{subfield-generated-is-quotients},
$y$ appartient à $k(x_i)_{i\in J}$ pour une sous-famille finie des
$x_i$, et d'après le (1), cette extension est finie sur $k$ donc
$k(y)$ l'est, c'est-à-dire que $y$ est algébrique sur $k$).
Concrètement, donc, les sommes, différences, produits et inverses de
quantités algébriques sur $k$ sont algébriques sur $k$.
(4) Si $k\subseteq K$ et $K\subseteq L$ sont algébriques alors
$k\subseteq L$ l'est (en effet, si $y \in L$, et si $x_1,\ldots,x_n
\in K$ sont les coefficients du polynôme minimal de $y$ sur $K$, alors
$y$ est algébrique sur $k(x_1,\ldots,x_n)$, qui est une extension
finie de $k$ d'après (1), donc $k(x_1,\ldots,x_n,y)$ est une extension
finie de $k(x_1,\ldots,x_n)$ donc de $k$, donc $k(y)$ est une
extension finie de $k$, donc $y$ est algébrique sur $k$).
\thingy\label{relative-algebraic-closure} L'observation (3) ci-dessus
entraîne que si $k\subseteq K$ est une extension de corps, l'extension
de $k$ engendrée par tous les éléments de $K$ algébriques sur $k$ est
tout simplement l'\emph{ensemble} de tous les éléments de $K$
algébriques sur $k$, c'est-à-dire que cet ensemble est un corps, qui
est manifestement la plus grande extension intermédiaire algébrique
sur $k$ : on l'appelle la \defin{fermeture algébrique} de $k$
dans $K$ (la précision « dans $K$ » est importante).
Si c'est précisément $k$, on dit que $k$ est \defin[algébriquement fermé (sous-corps)]{algébriquement
fermé} dans $K$ : autrement dit, cela signifie que tout élément
de $K$ est soit transcendant sur $k$ soit élément de $k$ (=algébrique
de degré $1$). Un corps algébriquement clos est algébriquement fermé
dans toute extension, mais un corps peut être algébriquement fermé
dans une extension sans pour autant être algébriquement clos (par
exemple $\mathbb{Q}$ dans le corps $\mathbb{Q}(t)$ des fractions
rationnelles).
D'après (4) ci-dessus, la fermeture algébrique de $k$ dans $K$ est
algébriquement fermée dans $K$.
\thingy\label{upgrade-algebraic-with-indeterminates} On peut aussi
remarquer le fait suivant : si $K$ est algébrique au-dessus de $k$,
alors $K(t_1,\ldots,t_n)$ où les $t_i$ sont des indéterminées (ou, de
façon équivalente, des éléments algébriquement indépendants sur $K$
d'un corps plus gros,
cf. \ref{remark-indeterminates-versus-transcendentals}) est algébrique
sur $k(t_1,\ldots,t_n)$. (En effet, $K(t_1,\ldots,t_n)$ est engendré
sur $k(t_1,\ldots,t_n)$ par tous les éléments de $K$, qui sont
algébriques sur $k$, donc certainement aussi sur $k(t_1,\ldots,t_n)$,
et on applique \ref{basic-facts-algebraic-extensions}(3).)
\subsection{Extensions linéairement disjointes}\label{section-linear-disjointness}
(On pourra se référer à \ref{reinterpretation-of-linear-disjointness}
plus bas pour une réinterprétation des résultats de cette section.)
\begin{defn}\label{definition-linear-disjointness}
Si $k \subseteq K$ et $k \subseteq L$ sont deux extensions contenues
dans une même troisième $M$, on dit qu'elles sont \defin[linéairement disjointes (extensions)]{linéairement
disjointes} lorsque toute famille d'éléments de $K$ linéairement
indépendante sur $k$ est encore linéairement indépendante sur $L$
quand on la voit comme une famille d'éléments de $M$. (Il suffit,
bien sûr, de le tester pour des familles \emph{finies}.)
\end{defn}
\thingy Remarquons que $K \cup L = k$ dans ces conditions (car si
$c\in K$ n'est pas dans $k$, il est linéairement indépendant avec $1$
sur $k$, donc il le reste sur $L$, et ne peut pas appartenir à $L$).
La condition d'être linéairement disjointes est cependant plus forte :
par exemple, $\mathbb{Q}(\sqrt[3]{2})$ et $\mathbb{Q}(\zeta
\sqrt[3]{2})$, où $\zeta$ est une racine primitive cubique de l'unité
(disons $\exp(2i\pi/3)$ dans les complexes) ont pour intersection
$\mathbb{Q}$ dans $\mathbb{Q}(\zeta, \sqrt[3]{2})$ (ou dans les
complexes), et pourtant elles ne sont pas linéairement disjointes
(vérifier que $1, \sqrt[3]{2}, \sqrt[3]{4}$ sont linéairement
indépendants sur $\mathbb{Q}$ mais que $(\zeta \sqrt[3]{2})^2 \times 1
+ (\zeta \sqrt[3]{2}) \times \sqrt[3]{2} + 1 \times \sqrt[3]{4} = 0$).
\medbreak
La définition de la relation d'être linéairement disjointes n'est pas
symétrique. Elle l'est cependant :
\begin{prop}
La propriété pour deux extensions contenues dans une même troisième
d'être linéairement disjointes est symétrique.
\end{prop}
\begin{proof}
Supposons $k \subseteq K$ et $k \subseteq L$ linéairement disjointes
comme on vient de le définir : on veut inverser le rôle de $L$ et $K$.
Soient $y_1,\ldots,y_n$ des éléments de $L$ linéairement indépendants
sur $k$. Supposons que pour certains $x_1,\ldots,x_n$ de $K$ non tous
nuls, on ait $x_1 y_1 + \cdots + x_n y_n = 0$ dans $M$. Quitte à
réordonner les $x_i$, on peut supposer que $x_1,\ldots,x_r$ sont
linéairement indépendants sur $k$ (avec $r\geq 1$) et que
$x_{r+1},\ldots,x_n$ en sont des combinaisons $k$-linéaires, disons
$x_i = \sum_{j=1}^r c_{i,j} x_j$ pour $i>r$ avec $c_{i,j} \in k$. La
relation $\sum_{i=1}^n x_i y_i = 0$ devient donc $\sum_{i=1}^r x_i y_i
+ \sum_{i=r+1}^n \sum_{j=1}^r c_{i,j} x_j y_i = 0$, soit, en
regroupant : $\sum_{j=1}^r \big(y_j + \sum_{i=r+1}^n c_{i,j} y_i\big)
x_j = 0$. Par indépendance linéaire des $x_i$ sur $k$ donc sur $L$,
on a $y_j + \sum_{i=r+1}^n c_{i,j} y_i = 0$ pour chaque $j\leq r$, ce
qui contredit l'indépendance linéaire des $y_i$ sur $L$.
\end{proof}
\begin{prop}\label{linear-disjointness-with-basis}
Soient $k \subseteq K$ et $k \subseteq L$ deux extensions contenues
dans une même troisième $M$, et soit $(v_j)$ une base de $K$ comme
$k$-espace vectoriel. Alors $K$ et $L$ sont linéairement disjointes
si et seulement si $(v_i)$ est encore linéairement indépendante sur
$L$ quand on la voit comme une famille d'éléments de $M$.
\end{prop}
\begin{proof}
La nécessité (« seulement si ») fait partie de la définition des
extensions linéairement disjointes appliquée à la base $(v_i)$.
Montrons la suffisance. Pour cela, soit $x_1,\ldots,x_n$ des éléments
de $K$ linéairement indépendants sur $k$, et soient $v_1,\ldots,v_m$
les éléments de la base qui interviennent dans l'écriture des $x_j$.
On peut écrire $x_j = \sum_{i=1}^m c_{i,j} v_j$ avec $c_{i,j} \in k$.
Le fait que les $x_j$ soient linéairement indépendants signifie
exactement que la matrice des $c_{i,j}$ a rang $n$. Mais \emph{le
rang d'une matrice ne dépend pas du corps sur lequel on la
considère}, si bien qu'elle a aussi rang $n$ quand on la voit comme
une matrice à coefficients dans $L$ : comme par hypothèse les
$v_1,\ldots,v_m$ vus comme des éléments de $M$ sont linéairement
indépendants sur $L$, ceci implique que les $x_j = \sum_{i=1}^m
c_{i,j} v_j$ vus comme des éléments de $M$ sont eux aussi linéairement
indépendants sur $L$. On a donc bien prouvé que $K$ et $L$ sont
linéairement disjointes.
\end{proof}
\thingy\label{definition-compositum} Lorsque $k \subseteq K$ et $k
\subseteq L$ sont deux extensions contenues dans une même
troisième $M$, on appelle \defin{composé} des corps $K$ et $L$ le
sous-corps de $M$ engendré par $K$ et $L$, autrement dit $k(K \cup L)
= K(L) = L(K)$, et on le note $K.L$.
\danger Il faut prendre garde au fait que l'extension composée n'a de
sens que si les deux extensions sont contenues dans une même troisième
(en changeant les plongements de $K$ et $L$ dans $M$ on peut changer
$K.L$ en un corps non isomorphe).
\begin{prop}\label{compositum-generated-by-products}
Si $k \subseteq K$ est une extension algébrique et $k \subseteq L$ une
extension quelconque, toutes les deux contenues dans une même
extension $M$, alors l'extension composée $K.L$ est le sous-$k$-espace
vectoriel de $M$ engendré par les produits $xy$ avec $x\in K$ et $y\in
L$.
\end{prop}
\begin{proof}
Soit $V$ le sous-$k$-espace vectoriel de $M$ engendré par les produits
$xy$ avec $x\in K$ et $y\in L$, autrement dit l'ensemble des $\sum_i
x_i y_i$ (sommes finies) avec $x_i \in K$ et $y_i \in L$ (les
coefficients dans $k$ peuvent s'absorber dans les $x_i$ ou les $y_i$).
Il est trivial que $V \subseteq K.L$, et pour prouver l'inclusion
contraire il suffit de montrer que $V$ est bien un corps. En
développant les produits $(\sum_i x_i y_i)(\sum x'_j y'_j) =
\sum_{i,j} (x_i x'_j)(y_i y'_j)$ on voit que $V$ est stable par
produit : c'est donc une algèbre sur $k$ ou $K$ ou $L$ comme on
préfère. Comme $V$ est un sous-anneau de $M$, qui est un corps, il
s'agit d'un anneau intègre.
Dans le cas où $[K:k] < \infty$, le $L$-espace vectoriel $V$ est
également de dimension finie, car une famille
génératrice $(v_j)$ de $K$ comme $k$-espace vectoriel est encore
génératrice de $V$ comme $L$-espace vectoriel (en effet, si tout
élément de $K$ peut s'écrire $\sum_j c_j v_j$ pour certains $c_i \in
k$, alors tout élément de $V$ peut s'écrire $\sum_i (\sum_j c_{i,j}
v_j) y_i = \sum_j (\sum_i c_{i,j} y_i) v_j$), et
d'après \ref{finite-integral-algebra-is-a-field} on en déduit que $V$
est un corps. On a donc obtenu le résultat annoncé pour le cas
où $[K:k] < \infty$.
En général, si $z \in V$ n'est pas nul, on peut écrire $z = \sum_i x_i
y_i$ pour certains $x_i \in K$ et $y_i \in L$. Soit $K_0$ l'extension
de $k$ engendrée par les $x_i$ : l'hypothèse selon laquelle $K$ est
algébrique entraîne que $[K_0:k] < \infty$
(cf. \ref{basic-facts-algebraic-extensions}(1)), et on a $z \in
K_0.L$. D'après le cas précédemment traité, tout élément de $K_0.L$,
et en particulier $z^{-1}$, appartient au sous-$k$-espace vectoriel
$V_0$ de $M$ engendré par les produits $xy$ avec $x\in K_0$ et $y\in
L$, et on a bien sûr $V_0 \subseteq V$. Donc $z^{-1} \in V$ et $V$
est bien un corps.
\end{proof}
\begin{prop}\label{base-of-compositum}
Si $k \subseteq K$ et $k \subseteq L$ sont deux extensions
linéairement disjointes contenues dans une même troisième, et si l'une
des deux est algébrique, alors toute base de $K$ sur $k$ est encore
une base de $K.L$ sur $L$.
\end{prop}
\begin{proof}
Soit $(v_j)$ une base de $K$ comme $k$-espace vectoriel. D'après la
définition de la relation d'être linéairement disjointes, les $(v_j)$
vus dans $K.L$ sont linéairement indépendants sur $L$. Mais d'après
la proposition \ref{compositum-generated-by-products}, tout élément de
$K.L$ peut s'écrire sous la forme d'une somme finie $\sum_i x_i y_i$
pour des $x_i \in K$ et $y_i \in L$, et on peut réécrire $x_i = \sum
c_{i,j} v_j$ donc $\sum_i x_i y_i = \sum_i (\sum_j c_{i,j} v_j) y_i =
\sum_j (\sum_i c_{i,j} y_i) v_j$ appartient au $L$-espace vectoriel
engendré dans $K.L$ par les $(v_j)$, c'est-à-dire que ceux-ci sont
générateurs, et finalement sont une base de $K.L$.
\end{proof}
\thingy\label{linear-disjointness-and-degrees} En particulier, dans
les conditions de la proposition ci-dessus, on a $[K.L : L] = [K :
k]$, et d'après \ref{remark-multiplicativity-of-degree} on a aussi
$[K.L : k] = [K : k] \cdot [L : k]$.
Réciproquement, si pour deux extensions $k \subseteq K$ et $k
\subseteq L$ contenues dans une même troisième on a l'égalité $[K.L :
L] = [K : k]$ \emph{finie} (notons que si à la fois $k \subseteq K$
et $k \subseteq L$ sont finies, il revient au même de supposer $[K.L
: k] = [K : k] \cdot [L : k]$), on peut considérer une base
(finie !) de $K$ comme $k$-espace vectoriel, qui,
d'après \ref{compositum-generated-by-products}, engendre $K.L$ comme
$L$-espace vectoriel, donc en est une base puisqu'elle a la bonne
taille : d'après \ref{linear-disjointness-with-basis}, ceci assure que
$K$ et $L$ sont linéairement disjointes.
\begin{prop}\label{linear-disjointness-of-algebraic-and-transcendental}
Soit $k \subseteq K$ une extension de corps, et $t_1,\ldots,t_n$ des
indéterminées. Alors les extensions $k\subseteq K$ et $k\subseteq
k(t_1,\ldots,t_n)$ sont linéairement disjointes dans
$K(t_1,\ldots,t_n)$, i.e., toute famille $k$-linéairement
indépendante de $K$ est encore linéairement indépendante sur
$k(t_1,\ldots,t_n)$ (dans $K(t_1,\ldots,t_n)$). Si de plus $K$ est
algébrique sur $k$, alors toute base de $K$ comme $k$-espace
vecotriel est une base de $K(t_1,\ldots,t_n)$ comme
$k(t_1,\ldots,t_n)$-espace vectoriel.
\end{prop}
\begin{proof}
Soit $(u_j)_{j\in J}$ une famille $k$-linéairement indépendante de
$K$ : montrons qu'ils sont linéairement indépendants sur
$k(t_1,\ldots,t_n)$. Si on a une relation de dépendance linéaire non
triviale $\sum_{j\in J} c_j u_j = 0$ dans $K(t_1,\ldots,t_n)$ avec
les $c_j$ dans $k(t_1,\ldots,t_n)$ tous nuls sauf un nombre fini, les
$c_j$ sont des fractions rationnelles ; cette même relation est
valable si on multiplie les $c_j$ par un dénominateur commun, si bien
qu'on peut supposer que les $c_j$ sont des polynômes en
$t_1,\ldots,t_n$ ; quitte à diviser autant de fois que nécessaire par
chaque $t_i$ qui divise tous les $c_j$, on peut supposer que le $c_j$
ne s'annulent pas tous à l'origine (i.e., quand on remplace tous les
$t_i$ par $0$) : mais alors, en les évaluant à l'origine (i.e., en
remplaçant tous les $t_i$ par $0$), on obtient une relation de
dépendance linéaire non-triviale sur $k$, qui est censée ne pas
exister. Ceci montre la première affirmation. La seconde découle
de \ref{base-of-compositum}.
\end{proof}
\subsection{Bases et degré de transcendance}
\begin{defn}\label{definition-transcendence-basis}
Si $k\subseteq K$ est une extension de corps, une famille finie
$x_1,\ldots,x_n$ d'éléments de $K$ est dite \defin[algébriquement indépendante (famille)]{algébriquement
indépendante} (il serait plus logique de dire « collectivement
transcendante ») sur $k$ lorsque le seul polynôme $P \in
k[t_1,\ldots,t_n]$ à coefficients dans $k$ et tel que
$P(x_1,\ldots,x_n) = 0$ (relation de « dépendance algébrique » sur $k$
entre les $x_i$) est le polynôme nul ; autrement dit, lorsque le
\index{évaluation}morphisme « d'évaluation » $k[t_1,\ldots,t_n] \to K$ (avec
$k[t_1,\ldots,t_n]$ l'anneau des polynômes en $n$ indéterminées)
envoyant $P$ sur $P(x_1,\ldots,x_n)$ est injectif. En particulier,
chacun des $x_i$ est transcendant sur $k$ ; et un unique élément $x$
de $K$ est algébriquement indépendant sur $k$ si et seulement si il
est transcendant sur $k$.
On dit d'une famille infinie $(x_i)_{i\in I}$ d'éléments de $K$
qu'elle est algébriquement indépendante sur $k$ lorsque toute
sous-famille finie d'entre eux l'est (i.e., il n'existe pas de
relation de dépendance algébrique entre les $x_i$, c'est-à-dire entre
un nombre fini d'entre eux).
Une famille $(x_i)_{i\in I}$ d'éléments de $K$ est appelée
\defin{base de transcendance} de $K$ sur $k$ lorsqu'elle est
algébriquement indépendante sur $k$ et que $K$ est algébrique
au-dessus de l'extension $k(x_i)_{i\in I}$ de $k$ engendrée par
les $x_i$.
\end{defn}
\thingy\label{remark-indeterminates-versus-transcendentals} Il est trivialement le cas que $t_1,\ldots,t_n$ sont
algébriquement indépendants si $t_1,\ldots,t_n$ sont des
indéterminées, c'est-à-dire, si $k(t_1,\ldots,t_n)$ est le corps des
fractions rationnelles en $n$ indéterminées. Réciproquement, si
$x_1,\ldots,x_n$ sont algébriquement indépendants, alors
$k(x_1,\ldots,x_n)$ s'identifie au corps des fractions rationnelles en
$n$ indéterminées comme dans le cas $n=1$ déjà vu
en \ref{monogeneous-extensions-dichotomy} ci-dessus (en envoyant
$P/Q$, avec $P,Q\in k[t_1,\ldots,t_n]$ et $Q\neq 0$, sur
$P(x_1,\ldots,x_n)/Q(x_1,\ldots,x_n)$).
(On peut encore dire la même chose pour un nombre infini de $x_i$, à
condition de définir le corps des fractions rationnelles en un nombre
infini d'indéterminées, comme « réunion », techniquement la limite
inductive, des corps de fractions rationnelles sur une sous-famille
finie quelconque d'entre elles.)
\thingy Lorsque les $(x_i)_{i\in I}$ sont algébriquement indépendants,
on dit aussi que l'extension $k \subseteq k(x_i)_{i\in I}$ est
\defin[transcendante pure (extension)]{transcendante pure} : autrement dit, une extension
transcendante pure est un corps de fractions rationnelles en un nombre
quelconque (peut-être infini, cf. ci-dessus) de variables.
La question de déterminer si une extension de corps est transcendante
pure peut être extrêmement difficile ; à titre d'exemple, le corps
$\mathbb{R}(x,y : x^2+y^2-1)$ des fractions de
$\mathbb{R}[x,y]/(x^2+y^2-1)$ est une extension transcendante pure de
$\mathbb{R}$, car il est en fait isomorphe à $\mathbb{R}(t)$ où $t =
\frac{y}{x+1}$ (de réciproque $x = \frac{1-t^2}{1+t^2}$ et $y =
\frac{2t}{1+t^2}$) : on reviendra sur cet exemple
en \ref{example-curve-circle}.
Certains auteurs disent parfois par abus de langage (ces notes
tâcheront de l'éviter) que $k \subseteq k(x_1,\ldots,x_n)$ est
transcendante pure pour dire en fait que les $x_1,\ldots,x_n$ sont
algébriquement indépendants. L'exemple ci-dessus montre que c'est
abusif ; cependant, on verra que ce ne l'est plus si on sait que le
degré de transcendance est bien $n$.
Si $(x_i)_{i\in I}$ est une base de transcendance de $K$ sur $k$,
celle-ci « décompose » l'extension $k \subseteq K$ en deux :
l'extension $k \subseteq k(x_i)_{i\in I}$ est transcendante pure, et
l'extension $k(x_i)_{i\in I} \subseteq K$ est algébrique.
\begin{prop}\label{transcendence-basis-facts}
Soit $k \subseteq K$ une extension de corps.
(1a) Toute famille algébriquement indépendante sur $k$ d'éléments
de $K$ se complète en une base de transcendance de $K$ sur $k$. (Ceci
s'applique notamment à la famille vide, donc il existe toujours une
base de transcendance de $K$ sur $k$.) (1b) De toute famille qui
engendre $K$ en tant qu'extension de corps de $k$, ou même qui
engendre un corps intermédiaire $E$ au-dessus duquel $K$ est
algébrique, on peut extraire une base de transcendance.
(2) \textit{Lemme d'échange :} Si $z_1,\ldots,z_n$ est une base de
transcendance finie de $K$ sur $k$ et $t$ un élément de $K$ tel que
$z_1,\ldots,z_\ell,t$ soient algébriquement indépendants sur $k$ (pour
un certain $\ell$, qui peut être $0$), alors il existe $j$ entre
$\ell+1$ et $n$ tel qu'en remplaçant $z_j$ par $t$ dans la base de
transcendance $z_1,\ldots,z_n$ on obtienne encore une base de
transcendance.
(3) Deux bases de transcendance de $K$ sur $k$ ont toujours le même
cardinal.
\end{prop}
\begin{proof}
(1a) Le principe de maximalité de
Hausdorff (\ref{hausdorff-maximal-principle}, appliqué à l'ensemble
$\mathscr{F}$ des familles algébriquement indépendantes sur $k$)
montre que toute famille algébriquement indépendante est contenue
dans une famille algébriquement indépendante maximale. Montrons
qu'une telle famille est une base de transcendance : si $(x_i)_{i\in
I}$ est une famille algébriquement indépendante maximale, on veut
donc prouver que $K$ est algébrique sur $k(x_i)_{i\in I}$ ; pour
cela, soit $t \in K$, on veut montrer qu'il n'est pas transcendant
sur $k(x_i)_{i\in I}$. Mais s'il l'est, on observe que la famille
obtenue en rajoutant $t$ à la famille $(x_i)_{i \in I}$ est encore
algébriquement indépendante : en effet, si on avait un polynôme
$P(t,x_{i_1},\ldots,x_{i_n})$ qui l'annulât, en considérant $P$
comme polynôme de la seule variable $t$ (dont il dépend
effectivement, sinon il donnerait une relation de dépendance
algébrique sur $k$ entre les $x_i$, chose qui n'existe pas) on
contredirait la transcendance de $t$ sur $k(x_i)_{i\in I}$. Par
maximalité de $(x_i)_{i\in I}$, ceci ne peut pas se produire : donc
$K$ est bien algébrique sur $k(x_i)_{i\in I}$ et $(x_i)_{i\in I}$
est une base de transcendance.
(1b) Soit maintenant $(x_i)_{i\in J}$ une famille génératrice (i.e.,
$K = k(x_i)_{i \in J}$) ou telle que $K$ soit algébrique sur $E =
k(x_i)_{i \in J}$ : soit $I$ une partie maximale de $J$ telle que
$(x_i)_{i\in I}$ soit algébriquement indépendante (de nouveau on
utilise le principe de maximalité), et on va montrer qu'il s'agit
d'une base de transcendance. Si ce n'est pas le cas, l'extension
$K$ de $k(x_i)_{i\in I}$ n'est pas algébrique, donc
(cf. \ref{basic-facts-algebraic-extensions}(3)) elle ne peut pas
être engendrée uniquement par des éléments algébriques, autrement
dit il existe $j\in J$ (et évidemment $j\not\in I$) tel que $x_j$
soit transcendant sur $k(x_i)_{i\in I}$, et par ce qu'on vient
d'expliquer la famille obtenue en rajoutant $j$ à $I$ contredit la
maximalité de $I$.
(2) Soit $z_1,\ldots,z_n$ une base de transcendance (finie) et $t \in
K$ tel que $z_1,\ldots,z_\ell,t$ soient algébriquement indépendants.
Puisque $t \in K$ est algébrique sur $k(z_1,\ldots,z_n)$, on peut
trouver une relation de dépendance algébrique $P(t,z_1,\ldots,z_n) =
0$ ; comme $z_1,\ldots,z_\ell,t$ sont algébriquement indépendants
par hypothèse, le polynôme $P$ ne peut pas dépendre que de ces
variables, donc il doit faire intervenir $z_j$ pour un certain $j$
entre $\ell+1$ et $n$. Soit $z'_i$ défini par $z'_i = z_i$ si
$i\neq j$ et $z'_j = t$. La relation $P(t,z_1,\ldots,z_n) = 0$, ou,
quitte à échanger deux variables, $\hat P(z_j,z'_1,\ldots,z'_n) =
0$, se lit aussi comme affirmant que $z_j$ est algébrique sur
$k(z'_1,\ldots,z'_n)$ : il s'ensuit que $K$ est algébrique sur
$k(z'_1,\ldots,z'_n)$ (puisqu'il est algébrique sur
$k(z_1,\ldots,z_n)$ et qu'on vient de voir que ce dernier est
algébrique sur $k(z'_1,\ldots,z'_n)$,
cf. \ref{basic-facts-algebraic-extensions} (3) et (4)). D'autre
part, les $z'_i$ sont algébriquement indépendants : car s'ils ne
l'étaient pas, comme les $z_1,\ldots,z_n$ le sont, une relation
$Q(z'_1,\ldots,z'_n)=0$ ferait intervenir $z'_j = t$, c'est-à-dire
que $t$ serait algébrique sur les autres $z'_i$, donc $z_j$ serait
algébrique sur les $z'_i = z_i$ pour $i \neq j$ (vu qu'on sait déjà
qu'il est algébrique sur tous les $z'_i$), or par hypothèse ce n'est
pas le cas. On a bien prouvé que les $z'_i$ forment une base de
transcendance de $K$ sur $k$.
(3) Tout d'abord, s'il existe une base de transcendance finie
$z_1,\ldots,z_n$, alors toute famille algébriquement indépendante
$x_1,\ldots,x_{n'}$ vérifie $n' \leq n$. En effet, si $n'>n$, le
lemme d'échange permet de remplacer un des $z_i$, mettons $z_1$, par
$x_1$, puis un des $z_i$ autre que $z_1$, mettons $z_2$, par $x_2$,
et ainsi de suite, toujours en obtenant des bases de transcendance.
Finalement, on voit que $x_1,\ldots,x_n$ est une base de
transcendance, contredisant le fait supposé que les $x_i$ pour
$n0$, alors l'application
$\Frob_p\colon k \to k$ définie par $x \mapsto x^p$, ou
\defin{Frobenius} d'exposant $p$, est un morphisme de corps, i.e., on
a $(x+y)^p = x^p + y^p$ et $(xy)^p = x^p y^p$ ; en particulier, il est
injectif. On notera $k^p$ l'image de ce morphisme
(cf. \ref{definition-perfect-field}), qui est donc un sous-corps
de $k$. Par exemple, $k^p[t]$ désigne l'anneau des polynômes dont les
coefficients sont des puissances $p$-ièmes.
L'application $x \mapsto x^{p^e}$ est l'itérée $e$-ième du Frobenius
et peut se noter indifféremment $\Frob_{p^e}$ ou $\Frob_p^e$. Son
image se note bien sûr $k^{p^e}$.
\thingy Si $k$ est un corps, et $f \in k[t]$ un polynôme en une
indéterminée sur $k$, on dit que $f$ est \defin[séparable (polynôme)]{séparable} lorsque
$f$ est premier avec sa dérivée $f'$ : ceci revient à dire que les
racines de $f$ sont simples (=sans multiplicité) dans une extension où
$f$ est scindé (cf. \ref{existence-uniqueness-decomposition-field}).
Lorsque $f$ est de plus irréductible (sur $k$), dire qu'il est
séparable signifie simplement que $f' \neq 0$ (puisque $f'$ ne peut
diviser $f$ qu'en étant nulle).
Si $k$ est de caractéristique $0$, tout polynôme irréductible est
séparable. Si $k$ est de caractéristique $p>0$, tout polynôme $f \in
k[t]$ s'écrit de façon unique sous la forme $f(t) = f_0(t^{p^e})$ pour
un certain $e \in \mathbb{N}$ et où $f_0' \neq 0$ (en effet, un
polynôme de dérivée nulle n'a que des termes d'exposant multiple
de $p$, et on itère) ; avec une telle écriture, si $f$ est séparable
alors $e = 0$, et si $f$ est irréductible alors $f_0$ l'est aussi.
\thingy\label{raising-polynomial-to-the-power-p} Le fait facile
suivant reviendra très souvent : si $g \in k[t]$ où $k$ est de
caractéristique $p$, alors $g(t)^p = g^{\Frob}(t^p)$ où $g^{\Frob}$
désigne le polynôme obtenu en élevant chaque coefficient de $g$ à la
puissance $p$ (c'est donc un élément de $k^p[t]$). En effet, si on
appelle $c_n$ le coefficient devant $t^n$ dans $g$, on a $(c_n t^n)^p
= (c_n)^p (t^n)^p$.
On a bien sûr de même $g(t)^{p^e} = g^{\Frob^e}(t^{p^e})$ où
$g^{\Frob^e} \in k^{p^e}[t]$ désigne le polynôme obtenu en élevant
chaque coefficient de $g$ à la puissance $p^e$.
\begin{lem}\label{power-in-kp-lemma}
Soit $k$ un corps de caractéristique $p>0$, et soit $h \in k[t]$ un
polynôme tel que $h^i \in k^p[t]$ pour un certain $1\leq i < p$.
Alors $h \in k^p[t]$.
\end{lem}
\begin{proof}
Comme $i$ est premier avec $p$, on peut trouver une relation de Bézout
$ui = 1 + vp$ avec $u,v\in\mathbb{N}$. On a alors $(h^i)^u = h\cdot
(h^p)^v$ avec $h^i \in k^p[t]$ par hypothèse et $h^p \in k^p[t]$
d'après \ref{raising-polynomial-to-the-power-p}. On a donc $h \in
k^p(t)$ (comme quotient de $(h^i)^u$ par $(h^p)^v$), et $h \in k[t]$,
et il suffit d'appliquer la remarque (triviale mais importante) que si
$k_0 \subseteq k$ est une extension de corps alors $k_0(t) \cap k[t] =
k_0[t]$.
\end{proof}
\begin{prop}\label{irreducibility-of-frobeniused-polynomials}
Soit $k$ un corps de caractéristique $p>0$, soit $f_0 \in k[t]$
unitaire irréductible, et soit $f(t) := f_0(t^{p^e})$ où $e>0$. Alors
$f$ est réductible (i.e., n'est pas irréductible) si et seulement si
les coefficients de $f_0$ (ou de façon équivalente, ceux de $f$) sont
des puissances $p$-ièmes, i.e., si et seulement si $f_0 \in k^p[t]$.
De plus, dans ce cas, $f$ est en fait une puissance $p$-ième
(cf. \ref{raising-polynomial-to-the-power-p}).
\end{prop}
\begin{proof}
Si $f_0 \in k^p[t]$, disons $f_0 = (f_1)^{\Frob}$ (c'est-à-dire le
polynôme obtenu en appliquant $\Frob_p$ coefficient par coefficient)
avec $f_1 \in k[t]$, alors $f(t) = f_0(t^{p^e}) =
(f_1(t^{p^{e-1}}))^p$ (cf. \ref{raising-polynomial-to-the-power-p}),
donc $f$ n'est pas irréductible.
Montrons la réciproque : supposons que les coefficients de $f_0$ ne
soient pas tous des puissances $p$-ièmes, et on veut montrer que $f$
est irréductible. Par récurrence, on se ramène au cas $e=1$,
c'est-à-dire $f(t) = f_0(t^p)$. Comme $\Frob_p$ est un isomorphisme
entre $k$ et $k^p$, il suffit de montrer que $f^{\Frob}$ est
irréductible dans $k^p[t]$. Or on a $f^{\Frob} = f_0(t)^p$ comme au
paragraphe précédent : dans $k[t]$, il s'agit d'une factorisation
irréductible (car on a supposé $f_0$ irréductible) ; donc tout
diviseur unitaire non-constant de $f^{\Frob}$ dans $k[t]$, et en
particulier tout facteur irréductible de $f^{\Frob}$ dans $k^p[t]$,
doit être de la forme $f_0^i$ pour un certain $1\leq i\leq p$. Mais
si $f_0^i \in k^p[t]$ pour $i
0$,
et $x \in K$ algébrique sur $k$. Exactement l'un des deux cas
suivants se produit :
\begin{itemize}
\item soit $x$ est séparable, le polynôme minimal de $x^p$ sur $k$ a
des coefficients dans $k^p$, et alors $\deg(x^p) = \deg(x)$ et $k(x)
= k(x^p)$,
\item soit $x$ n'est pas séparable, le polynôme minimal de $x^p$
sur $k$ a des coefficients qui ne sont pas tous dans $k^p$, et alors
on a déjà vu $\deg(x^p) = \deg(x)/p$.
\end{itemize}
\end{prop}
\begin{proof}
Soit $f_0$ le polynôme minimal de $x^p$ sur $k$, et soit $f(t) =
f_0(t^p)$, de sorte que $f \in k[t]$ annule $x$. D'après la
proposition \ref{irreducibility-of-frobeniused-polynomials}, deux cas
peuvent se produire : soit les coefficients de $f_0$ sont des
puissances $p$-ièmes auquel cas $f$ est une puissance $p$-ième, soit
$f$ est irréductible dans $k[t]$. Dans le premier cas, disons $f =
f_1^p$, alors $\deg(f_1) = \deg(f_0)$ et $f_1(x) = 0$, ce qui montre
$\deg(x) \leq \deg(x^p)$, mais l'inclusion réciproque est évidente
puisque $k(x^p) \subseteq k(x)$, et l'égalité des degrés montre
l'égalité des corps. Dans le second cas, $f$ est le polynôme minimal
de $x$ sur $k$, et on a $\deg(f) = p\cdot \deg(f_0)$ donc $\deg(x) =
p\cdot \deg(x^p)$.
\end{proof}
\thingy\label{linear-criterion-for-separability} On peut donner encore
une autre condition équivalente au fait qu'un élément $x \in K$
algébrique sur un sous-corps $k$ soit séparable (en
caractéristique $p>0$) : on vient de voir que cela équivaut à
$\deg(x^p) = \deg(x)$ ou à $k(x^p) = k(x)$ ; mais comme on a de toute
manière $[k(x):k] = [k^p(x^p) : k^p]$ (puisque le Frobenius est un
isomorphisme entre $k(x)$ et $k^p(x^p)$), la séparabilité de $x$
équivaut aussi à $[k(x^p):k] = [k^p(x^p) : k^p]$, c'est-à-dire,
d'après \ref{linear-disjointness-and-degrees}, au fait que les
extensions $k^p(x^p)$ et $k$ de $k^p$ sont linéairement disjointes
(cf. \ref{definition-linear-disjointness}). C'est cette façon de voir
les choses qui va inspirer l'énoncé et la démonstration
de \ref{linear-criterion-for-separable-algebraic-extensions}.
\thingy\label{definition-separable-algebraic-extension} Une extension
de corps $k \subseteq K$ algébrique est dite \defin[séparable (extension)]{séparable} (ou
que $K$ est séparable sur / au-dessus de $k$) lorsque tout élément
de $K$ est séparable sur $k$ (cf. \ref{definition-separable-element}).
C'est, bien sûr, toujours le cas en caractéristique $0$.
\begin{prop}\label{linear-criterion-for-separable-algebraic-extensions}
Soit $k \subseteq K$ une extension de corps \emph{finie} de
caractéristique $p$ telle que $K^p$ engendre $K$ comme $k$-espace
vectoriel. Alors $K$ est séparable sur $k$.
\end{prop}
\begin{proof}[Démonstration utilisant \ref{linear-disjointness-and-degrees}]
On a $[K^p : k^p] = [K : k]$ car $\Frob$ est un isomorphisme de $K$
sur $K^p$. Par hypothèse, $K = K^p.k$
(cf. \ref{definition-compositum} pour la notation, et
cf. aussi \ref{compositum-generated-by-products}) : ainsi, $[K^p.k :
k] = [K^p : k^p]$, donc
d'après \ref{linear-disjointness-and-degrees} les extensions $K^p$ et
$k$ de $k^p$ sont linéairement disjointes. En particulier, si $y\in
K$, les extensions $k^p(y^p)$ et $k$ sont linéairement disjointes, ce
qui d'après \ref{linear-criterion-for-separability} implique que $y$
est séparable sur $k$.
\end{proof}
\begin{proof}[Démonstration directe (déroulée)]
Soit $d = [K:k]$ et soit $x_1,\ldots,x_d$ une base de $K$ comme
$k$-espace vectoriel. Soit $y \in K$ : on veut montrer que $y$ est
séparable sur $k$. Écrivons $y^j = \sum_{i=0}^{d-1} c_{i,j} x_i$ sur
cette base, pour $0\leq j\leq d'-1$ avec $d' = \deg(y)$ : le fait que
$y$ soit de degré $d'$ entraîne que $1,y,\ldots,y^{d'-1}$ sont
linéairement indépendants sur $k$, autrement dit la matrice des
$c_{i,j}$ est de rang $d'$. Maintenant, en élevant $y^j =
\sum_{i=0}^{d-1} c_{i,j} x_i$ à la puissance $p$, on trouve $y^{pj} =
\sum_{i=0}^{d-1} c_{i,j}^p x_i^p$.
L'hypothèse que $K^p$ engendre $K$ comme $k$-espace vectoriel signifie
que tout élément de $K$ peut s'écrire comme combinaison linéaire
d'éléments de $K^p$ à coefficients dans $k$ ; comme les éléments de
$K^p$ peuvent eux-mêmes s'écrire comme combinaisons linéaires des
$x_1^p,\ldots,x_d^p$ à coefficients dans $k^p$ (donc dans $k$), on
voit que $x_1^p,\ldots,x_d^p$ engendrent $K$ comme $k$-espace
vectoriel, donc en sont une base (puisque $[K:k] = d$).
Or la matrice des $c_{i,j}^p$ est de rang $d'$ car le Frobenius est un
isomorphisme de $k$ sur $k^p$ et que \emph{le rang d'une matrice ne
dépend pas du corps sur lequel on la considère}. Des trois
dernières phrases, on déduit que $1,y^p,\ldots,y^{p(d'-1)}$ sont
linéairement indépendants sur $k$, c'est-à-dire que $\deg(y^p) \geq
d'$, l'inégalité dans le sens contraire étant évidente on a $\deg(y^p)
= \deg(y)$ et $y$ est séparable.
\end{proof}
\thingy L'hypothèse « finie » est essentielle
dans \ref{linear-criterion-for-separable-algebraic-extensions}, et ne
peut pas être remplacée par « algébrique » : un contre-exemple est
fourni par $k = \mathbb{F}_p(t)$ et pour $K$ la réunion des
$\mathbb{F}_p(t^{1/p^i})$ pour $i\in\mathbb{N}$ (chaque
$\mathbb{F}_p(t^{1/p^i})$ est un corps de fractions rationnelles à une
indéterminée $t^{1/p^i}$, plongé dans les suivants en identifiant
$t^{1/p^i}$ à $(t^{1/p^j})^{p^{j-i}}$ si $j\geq i$ : on dit que $K$
est la « clôture parfaite » de $k$, on l'obtient en prenant toutes les
racines $p^i$-ièmes des éléments de $k$). Alors $k \subseteq K$ est
une extension algébrique ; et $K$ est un corps parfait
(cf. \ref{definition-perfect-field}), c'est-à-dire que $K^p = K$ (on
l'a construit exprès pour), et a fortiori $K^p$ engendre $K$ comme
$k$-espace vectoriel : pourtant, l'extension $k \subseteq K$ n'est
aucunement séparable (elle est même « purement inséparable »).
\begin{prop}\label{tower-of-finite-separable-extensions}
Soit $k \subseteq K$ une extension de corps. Si $x_1,\ldots,x_n$ sont
des éléments de $K$ tels que $x_i$ est algébrique séparable sur
$k(x_1,\ldots,x_{i-1})$ pour chaque $1\leq i\leq n$, alors
$k(x_1,\ldots,x_n)$ est séparable sur $k$.
\end{prop}
\begin{proof}
En caractéristique $0$, il n'y a rien à prouver : plaçons-nous en
caractéristique $p > 0$.
Comme $x_1$ est séparable sur $k$, on a $k(x_1) = k(x_1^p)$ ; comme
$x_2$ est séparable sur $k(x_1)$, on a $k(x_1,x_2) = k(x_1)(x_2) =
k(x_1)(x_2^p) = k(x_1^p)(x_2^p) = k(x_1^p,x_2^p)$, et en procédant
ainsi de suite on voit que $k(x_1,\ldots,x_n) =
k(x_1^p,\ldots,x_n^p)$. L'hypothèse
de \ref{linear-criterion-for-separable-algebraic-extensions} est donc
vérifiée (les monômes en $x_1^p,\ldots,x_n^p$
engendrent $k(x_1,\ldots,x_n)$ comme $k$-espace vectoriel,
cf. \ref{basic-facts-algebraic-extensions}(1bis)), donc
$k(x_1,\ldots,x_n)$ est séparable sur $k$.
\end{proof}
\begin{cor}\label{separably-generated-algebraic-extension-is-separable}
Soit $K = k(x_i)_{i\in I}$ avec les $x_i$ algébriques séparables
sur $k$. Alors tout $K$ est (algébrique) séparable sur $k$.
(Comparer avec \ref{basic-facts-algebraic-extensions}(3).)
Concrètement, donc, les sommes, différences, produits et inverses de
quantités algébriques séparables sur $k$ sont algébriques séparables
sur $k$.
\end{cor}
\begin{proof}
Il s'agit de montrer que tout élément de $K$ est séparable sur $k$ :
comme tout élément de $K = k(x_i)_{i\in I}$ s'écrit en utilisant un
ensemble fini des $x_i$, i.e., appartient à $k(x_i)_{i\in J}$ pour $J
\subseteq I$ fini (cf. \ref{subfield-generated-is-quotients}), on peut
supposer que $J$ est fini, disons $J = \{1,\ldots,n\}$, bref $K =
k(x_1,\ldots,x_n)$. Chaque $x_i$ est séparable sur $k$ donc \textit{a
fortiori} sur $k(x_1,\ldots,x_{i-1})$ et le résultat découle
de \ref{tower-of-finite-separable-extensions}.
\end{proof}
\begin{cor}\label{tower-of-separable-extensions-is-separable}
Soit $k \subseteq K \subseteq L$ une tour d'extensions algébriques.
Si $K$ est séparable sur $k$ et $L$ est séparable sur $K$, alors $L$
est séparable sur $k$ (la réciproque est claire).
(Comparer avec \ref{basic-facts-algebraic-extensions}(4).)
\end{cor}
\begin{proof}
Si $y\in L$ et si $x_1,\ldots,x_n \in K$ sont les coefficients du
polynôme minimal de $y$ sur $K$, alors $y$ est algébrique séparable
sur $k(x_1,\ldots,x_n)$ et $x_1,\ldots,x_n$ sont séparables sur $k$ :
le résultat découle de \ref{tower-of-finite-separable-extensions}.
\end{proof}
\thingy\label{separable-closure} (Comparer
avec \ref{relative-algebraic-closure}.) La
proposition \ref{separably-generated-algebraic-extension-is-separable}
entraîne que si $k\subseteq K$ est une extension de corps, l'extension
de $k$ engendrée par tous les éléments de $K$ algébriques séparables
sur $k$ est tout simplement l'\emph{ensemble} de tous les éléments
de $K$ algébriques séparables sur $k$, c'est-à-dire que cet ensemble
est un corps, qui est manifestement la plus grande extension
intermédiaire algébrique séparable sur $k$ : on l'appelle la
\defin[fermeture séparable]{fermeture [algébrique] séparable} de $k$ dans $K$.
La fermeture séparable de $k$ dans une clôture algébrique de $k$
(cf. \ref{definition-algebraic-closure}) s'appelle \defin{clôture
séparable} de $k$. Si $k$ est égal à sa clôture séparable (i.e.,
séparablement fermé dans une clôture algébrique), on dit que $k$ est
\defin[séparablement clos (corps)]{séparablement clos}.
\thingy Une extension algébrique $k \subseteq K$ telle que $k$ soit
égal à sa propre fermeture séparable dans $K$ (i.e. séparablement
fermé \emph{dans $K$}) est dite \defin{purement inséparable}. Dans
ce cas, en notant $p>0$ la caractéristique, le polynôme minimal
sur $k$ d'un élément quelconque de $K$ est de la forme $t^{p^e} - c$
pour un $c \in k$ (car si $f$ est le polynôme minimal de $x \in K$ et
si $f(t) = f_0(t^{p^e})$ avec $f_0$ séparable comme d'habitude,
l'élément $c := x^{p^e}$ de $K$ est annulé par $f_0$ donc séparable
sur $k$ donc dans $k$, donc $f_0$ est de la forme $t-c$) ; et
réciproquement, si cette condition est vérifiée, l'extension est
purement inséparable (car un polynôme de la forme $t^{p^e} - c$ n'est
séparable que pour $e=0$).
\thingy On pourrait définir la notion de \defin{degré séparable}
d'une extension algébrique $k \subseteq K$, qui est le degré sur $k$
de la fermeture séparable $k'$ de $k$ dans $K$, soit
$[K:k]_{\sep} := [k':k]$ (et dualement $[K:k]_{\mathrm{ins}}
:= [K:k']$ le \defin{degré inséparable}). Les degrés séparables (et
les degrés inséparables) se multiplient comme les degrés
(cf. \ref{remark-multiplicativity-of-degree}) : nous ne ferons pas la
démonstration, mais le point-clé est que si $k\subseteq K$ est une
extension purement inséparable (i.e., telle que $k$ soit séparablement
fermé dans $K$) et $K \subseteq K'$ une extension séparable, et si
$k'$ est la fermeture séparable de $k$ dans $K'$, alors $[k':k] =
[K':K]$, c'est-à-dire que les extensions $K$ et $k'$ de $k$ sont
linéairement disjointes (cf. \ref{linear-disjointness-and-degrees}),
ce qui se voit de façon analogue
à \ref{linear-criterion-for-separable-algebraic-extensions}.
\subsection{Corps parfaits, théorème de l'élément primitif}
\begin{defn}\label{definition-perfect-field}
Un corps $k$ est dit \defin[parfait (corps)]{parfait} lorsque \emph{soit} $k$ est de
caractéristique $0$, \emph{soit} $k$ est de caractéristique $p$ et le
morphisme de Frobenius, $\Frob\colon x\mapsto x^p$, est surjectif $k
\to k$, i.e. tout élément a une racine $p$-ième (automatiquement
unique car $\Frob$ est injectif), ou si on préfère, $k^p = k$.
\end{defn}
\thingy Ainsi, les corps $\mathbb{Q},\mathbb{R},\mathbb{C}$ sont
parfaits (car de caractéristique $0$). Il en va de même d'un corps
fini $\mathbb{F}_q$ (car le morphisme de Frobenius, injectif d'un
ensemble fini vers lui-même, est forcément surjectif). Enfin, un
corps algébriquement clos est parfait (car le polynôme $x^p - c$ se
scinde).
Un exemple de corps qui \emph{n'est pas} parfait est le corps
$\mathbb{F}_p(t)$ des fractions rationnelles en une indéterminée $t$
sur $\mathbb{F}_p$, vu que l'élément $t$ n'a pas de racine $p$-ième.
\thingy\label{field-is-perfect-iff-every-algebraic-is-separable} Si
$k$ est parfait, tout élément $x$ algébrique sur $k$ (dans un corps le
contenant) est séparable : ceci découle de la
proposition \ref{separable-inseparable-dichotomy}.
Réciproquement, si tout élément $x$ algébrique sur $k$ (dans un corps
le contenant, ou, mieux, dans une clôture algébrique $K$ fixée) est
séparable, alors $k$ est parfait : en effet, si $x\in k$, on peut
considérer $y$ sa racine $p$-ième dans la clôture algébrique $K$ :
puisque $t^p - x = (t-y)^p$ dans $K[t]$, toutes ses racines sont
égales à $y$, donc le polynôme minimal de $y$ sur $k$ est de la forme
$(t-y)^r$ pour un certain $1\leq r\leq p$, et s'il est séparable c'est
que $r=1$ donc $y\in k$.
Bien sûr, on peut aussi dire qu'un corps $k$ est parfait si et
seulement si toute extension algébrique de $k$ est séparable
(cf. \ref{definition-separable-algebraic-extension}
et \ref{separably-generated-algebraic-extension-is-separable}).
\begin{prop}
Si $k \subseteq K$ est une extension algébrique avec $k$ parfait,
alors $K$ est aussi parfait.
\end{prop}
\begin{proof}
D'après \ref{field-is-perfect-iff-every-algebraic-is-separable}, il
suffit de montrer que tout algébrique sur $K$ est séparable. Mais un
algébrique sur $K$ est en particulier algébrique sur $k$
(cf. \ref{basic-facts-algebraic-extensions}(4)), donc de nouveau
d'après \ref{field-is-perfect-iff-every-algebraic-is-separable} il est
séparable sur $k$ donc sur $K$.
\end{proof}
\begin{prop}[théorème de l'élément primitif]\label{primitive-element-theorem}
Soit $K = k(x_1,\ldots,x_n)$ avec $x_1,\ldots,x_n$ algébriques sur $k$
et $x_2,\ldots,x_n$ séparables sur $k$ (on ne suppose pas que $x_1$
soit séparable). Alors l'extension $k\subseteq K$ est monogène,
c'est-à-dire qu'il existe $y \in K$ tel que $K = k(y)$.
\end{prop}
\begin{proof}
Si $k$ est un corps fini, alors $K$ l'est aussi (puisque $K$ est fini
sur $k$), et on peut choisir $y$ un générateur du groupe cyclique
$K^\times$ (vu que ses puissances sont tous les éléments
de $K^\times$, il engendre certainement $K$ en tant que corps).
Excluons donc ce cas.
En procédant par récurrence sur $n$, on voit qu'il suffit de montrer
le cas $n=2$. Supposons donc $K = k(x_1,x_2)$ avec $x_1,x_2$
algébriques et $x_2$ séparable. On va poser $y = x_1 + c x_2$ et
chercher à choisir judicieusement $c \in k$ non nul. Pour montrer que
$K = k(y)$, il suffira de montrer que $x_2$ est dans $k(y)$, puisque
ensuite $x_1 = y - c x_2$. Pour cela, on va s'intéresser au polynôme
minimal de $x_2$ sur $k(y)$ : il s'agit de montrer qu'il a degré $1$
(pour $c$ bien choisi).
Soient $f_1$ et $f_2$ les polynômes minimaux de $x_1$ et $x_2$
sur $k$. Travaillons dans $L$ une extension de $K$ dans laquelle $f_1
f_2$ est scindé (cf. \ref{existence-uniqueness-decomposition-field}).
L'élément $x_2$ est racine de $f_2(t)$ et aussi de $g(t) := f_1(y -
ct)$, ce dernier étant un polynôme en $t$ à coefficients dans $k(y)$ :
il est donc racine de leur pgcd $h$ dans $k(y)[t]$. Or toute racine
de ce pgcd dans $L$ est à la fois racine de $f_2$, appelons-la $z_2$,
et aussi de la forme $(y - z_1)/c$ pour une certaine racine $z_1$
de $f_1$ ; on a donc $y = x_1 + c x_2 = z_1 + c z_2$, et si $z_2 \neq
x_2$ cela implique $c = (z_1 - x_1)/(x_2 - z_2)$. Autrement dit, si
on choisit pour $c$ une valeur dans $k$ différente de tous les $(z_1 -
x_1)/(x_2 - z_2)$ pour $z_1$ parcourant les racines de $f_1$ et $z_2$
parcourant celles de $f_2$ (autres que $x_2$), ce qui est possible vu
que $k$ est infini et qu'on n'exclut qu'un nombre fini de valeurs,
alors la seule racine commune de $f_2$ et $g$ est $x_2$. Comme de
plus $f_1$ est séparable, cette racine est simple pour $f_1$ donc
pour $h$, et ainsi $x_2$ est racine d'un polynôme $h$ dans $k(y)$
ayant une unique seule racine, de surcroît simple, dans un corps $L$
où ce polynôme se scinde (parce que $f_2$ s'y scinde). C'est donc que
$x_2 \in k(y)$, et on a expliqué que cela conclut.
\end{proof}
\begin{cor}\label{finite-separable-extensions-are-monogeneous}
Toute extension finie séparable est monogène. En particulier, toute
extension finie d'un corps parfait est monogène.
\end{cor}
\begin{proof}
Soit $k \subseteq K$ une extension finie séparable : d'après
\ref{basic-facts-algebraic-extensions}(2), elle est engendrée par un
nombre fini d'éléments algébriques, ceux-ci sont séparables sur $k$
par définition, et d'après \ref{primitive-element-theorem},
l'extension est monogène. Si $k$ est parfait, toute extension
algébrique de $k$ est séparable.
\end{proof}
\begin{prop}\label{separating-transcendence-basis-over-perfect-field}
Soit $k$ un corps parfait et $k \subseteq K$ une extension de corps de
type fini (cf. \ref{subfield-generated}). Alors il existe
$x_1,\ldots,x_{d+1} \in K$ tels que $K = k(x_1,\ldots,x_{d+1})$ avec
$x_1,\ldots,x_d$ algébriquement indépendants sur $k$
(cf. \ref{definition-transcendence-basis}) et $x_{d+1}$ algébrique
séparable sur $k(x_1,\ldots,x_d)$
(cf. \ref{definition-separable-element}).
\end{prop}
\begin{proof}
Supposons $K = k(w_1,\ldots,w_n)$ et soit $d = \degtrans_k(K)$ :
quitte à permuter les $w_i$, on peut supposer que $w_1,\ldots,w_d$
sont algébriquement indépendants sur $K$
(cf. \ref{transcendence-basis-facts}(1b)). Alors tout $y \in K$ est
algébrique sur $k(w_1,\ldots,w_d)$, donc on peut écrire
$f(w_1,\ldots,w_d,y) = 0$ avec $f \in k(t_1,\ldots,t_d)[u]$
irréductible, donc, quitte à chasser les dénominateurs, $f \in
k[t_1,\ldots,t_d,u]$ irréductible
(cf. \ref{gauss-lemma-on-irreducibility}).
En particulier, on peut trouver un tel polynôme $f \in
k[t_1,\ldots,t_{d+1}]$ irréductible tel que $f(w_1,\ldots,w_{d+1}) =
0$. Considérons un tel polynôme.
Expliquons maintenant pourquoi il existe $1\leq i\leq d+1$ tel que la
dérivée partielle $f'_i$ de $f$ par rapport à la variable $t_i$ ne
soit pas identiquement nulle. En effet, si on avait $f'_i = 0$ pour
chaque $i$, alors chaque variable $t_i$ n'apparaîtrait qu'à des
puissances multiples de la caractéristique $p>0$, donc on pourrait
écrire $f(t_1,\ldots,t_{d+1}) = f_0(t_1^p,\ldots,t_{d+1}^p)$. Quitte
à considérer la racine $p$-ième de chaque coefficient de $f_0$ (qui
existe car $k$ est algébriquement clos),
d'après \ref{raising-polynomial-to-the-power-p} (ou son analogue
évident à plusieurs variables), on voit que $f$ serait une puissance
$p$-ième, contredisant l'irréductibilité.
Les éléments $w_1,\ldots,w_{i-1},w_{i+1},\ldots,w_{d+1}$ sont
algébriquement indépendants sur $i$. En effet, le fait que $f'_i \neq
0$ assure que $t_i$ apparaît vraiment dans $f(t_1,\ldots,t_{d+1})$
donc $w_i$ est algébrique sur
$k(w_1,\ldots,w_{i-1},w_{i+1},\ldots,w_{d+1})$, donc le degré de
transcendance de $k(w_1,\ldots,w_{i-1},w_{i+1},\ldots,w_{d+1})$
sur $k$ est le même que celui de $k(w_1,\ldots,w_{d+1})$, qui
vaut $d$, or $d$ éléments ne peuvent engendrer une extension de degré
de transcendance $d$ qu'en étant algébriquement indépendants
(cf. \ref{transcendence-basis-facts} (1a) et (3)).
Ainsi, quitte à permuter $w_i$ avec $w_{d+1}$ (si $i\neq d+1$), on
peut s'arranger, tout en gardant $w_1,\ldots,w_d$ algébriquement
indépendants, pour avoir $f'_{d+1} \neq 0$ : ce fait assure que
$w_{d+1}$ est non seulement algébrique mais même séparable
sur $k(w_1,\ldots,w_d)$.
Mais en procédant de même pour $w_{d+2},\ldots,w_n$, on peut s'assurer
(à chaque fois quitte à permuter le $w_j$ considéré, $j\geq d+1$, avec
un $w_i$ pour $1\leq i\leq d$) que chacun de $w_{d+1},\ldots,w_n$ est
algébrique séparable sur $k(w_1,\ldots,w_d)$, toujours avec
$w_1,\ldots,w_d$ algébriquement indépendants. Posons $x_i = w_i$ pour
$1\leq i\leq d$. Le théorème \ref{primitive-element-theorem} appliqué
à l'extension de $k(x_1,\ldots,x_d) = k(w_1,\ldots,w_d)$ engendrée par
les éléments algébriques séparables $w_{d+1},\ldots,w_n$ montre que
celle-ci est engendrée par un unique élément $x_{d+1}$, et comme cette
extension est séparable
d'après \ref{separably-generated-algebraic-extension-is-separable},
l'élément $x_{d+1}$ est séparable.
\end{proof}
\subsection{Théorie de Galois : énoncé de résultats}
\thingy\label{definition-conjugate-elements}
Si $K$ est un corps et $L$ une extension algébrique de $K$
deux éléments $x,x'$ de $L$ sont dits \defin[conjugués (éléments)]{conjugués} sur $K$
lorsqu'ils ont le même polynôme minimal sur $K$, autrement dit,
lorsque l'un est racine du polynôme minimal de l'autre (il s'agit
d'une relation d'équivalence dont les classes sont parfois appelées
\defin[conjugaison (classe de)]{classes de conjugaison} au-dessus de $K$). De façon
équivalente, deux éléments $x,x'$ de $L$ sont conjugués lorsque tout
polynôme de $K[t]$ qui s'annule sur l'un s'annule aussi sur l'autre.
Les conjugués de $x \in L$ sont généralement considérés dans une
clôture algébrique $K^{\alg} = L^{\alg}$ de $L$ (donc de $K$) :
l'intérêt de considérer la clôture algébrique est que le polynôme
minimal de $x$ sur $K$ se scinde dans $K^{\alg}$. Si $x$ est de plus
séparable (cf. \ref{definition-separable-element}), son polynôme
minimal sur $K$ est à racines simples dans $K^{\alg}$, donc le nombre
de conjugués de $x$ sur $K$ est égal à $\deg(x)$.
À titre d'exemple, les conjugués sur $\mathbb{Q}$ de $\sqrt{2}$ sont
$\sqrt{2}$ et $-\sqrt{2}$ ; les conjugués sur $\mathbb{R}$ de
$42+1729i$ sont lui-même et $42-1729i$ ; les conjugués sur
$\mathbb{Q}$ de $\sqrt[3]{2}$ sont les $\zeta^r \sqrt[3]{2}$ pour
$r\in\{0,1,2\}$ avec $\zeta$ une racine primitive cubique de l'unité
(disons $\exp(2i\pi/3)$ dans les complexes) ; et les conjugués d'un $x
\in \mathbb{F}_q$, pour $q = p^d$, au-dessus de $\mathbb{F}_p$, sont
les $\Frob_p^r(x) = x^{p^r}$ pour $0\leq r \leq d-1$.
\thingy\label{definition-normal-extension} Une extension de corps $K
\subseteq L$ algébrique est dite \defin[normale (extension)]{normale} lorsqu'elle vérifie
les propriétés suivantes dont on peut montrer qu'elles sont
équivalentes :
\begin{itemize}
\item (en notant $L^{\alg}$ une clôture algébrique de $L$,) tout
conjugué sur $K$ (dans $L^{\alg}$) d'un élément de $L$ est encore
dans $L$,
\item tout polynôme irréductible sur $K$ qui a une racine dans $L$ est
scindé sur $L$ (i.e., il y a toutes ses racines),
\item $L$ est corps de décomposition
(cf. \ref{definition-decomposition-field}) d'une famille de
polynômes sur $K$,
\item (en notant $L^{\alg}$ une clôture algébrique de $L$,) l'image de
tout morphisme de corps $L \to L^{\alg}$ qui soit l'identité sur $K$
est égale à $L$ (et le morphisme définit donc un automorphisme
de $L$ qui soit l'identité sur $K$).
\end{itemize}
À titre d'exemple, $\mathbb{R} \subseteq \mathbb{C}$ ou $\mathbb{Q}
\subseteq \mathbb{Q}(\sqrt{2})$ ou encore $\mathbb{F}_p \subseteq
\mathbb{F}_{p^d}$ sont des extensions normales (ce sont les corps de
décomposition de $t^2 + 1$, de $t^2 - 2$ et de $t^{p^d} - 1$
respectivement) ; en revanche, $\mathbb{Q} \subseteq
\mathbb{Q}(\sqrt[3]{2})$ \emph{n'est pas} normale (il s'agit du corps
de rupture de $t^3 - 2$, c'est une extension de degré $3$, donc ne
contenant pas de racine primitive cubique $\zeta$ de l'unité qui est
algébrique de degré $2$).
(On appelle \defin{fermeture normale} de $L$ au-dessus de $K$
dans $L^{\alg}$ le corps de décomposition des polynômes minimaux
sur $K$ de tous les éléments de $L$, i.e., le sous-corps de $L^{\alg}$
engendré par tous les conjugués de tous les éléments de $L$, ou encore
le composé, cf. \ref{definition-compositum}, de tous les $\sigma(L)$
pour $\sigma \colon L \to L^{\alg}$ un morphisme de corps qui soit
l'identité sur $K$. À titre d'exemple, la fermeture normale de
$\mathbb{Q}(\sqrt[3]{2})$ au-dessus de $\mathbb{Q}$ est le corps
$\mathbb{Q}(\zeta,\sqrt[3]{2})$ de décomposition de $t^3 - 2$.)
\thingy Une extension algébrique $K \subseteq L$ qui soit à la fois
normale (cf. \ref{definition-normal-extension}) et séparable
(cf. \ref{definition-separable-algebraic-extension}) est dite
\defin[galoisienne (extension)]{galoisienne}.
À titre d'exemple, une clôture séparable $K \subseteq K^{\sep}$ de $K$
fournit une extension galoisienne (elle est séparable par définition,
et elle est normale car un conjugué d'un élément séparable est
séparable puisqu'ils ont le même polynôme minimal). On rappelle que
si $K$ est parfait, la clôture séparable coïncide avec la clôture
algébrique.
\thingy Si $K \subseteq L$ est une extension galoisienne, on appelle
\defin[Galois (groupe de)]{groupe de Galois} de l'extension, et on note $\Gal(K\subseteq
L)$ l'ensemble des automorphismes de $L$ au-dessus de $K$, ou
$K$-automorphismes de $L$, c'est-à-dire l'ensemble des automorphismes
de $K$-algèbres $L \to L$ (automorphismes de $L$ = isomorphismes de
$L$ sur lui-même), c'est-à-dire encore l'ensemble des automorphismes
de $L$ qui soient l'identité sur $K$. Lorsque $L$ est la clôture
séparable de $K$, on dit que $\Gal(K\subseteq L)$ est le groupe de
Galois \defin[absolu (groupe de Galois)]{absolu} de $K$ et on le note $\Gal(K)$ ou parfois
$\Gamma_K$.
Les deux exemples suivant sont essentiels : le groupe de Galois de
$\mathbb{R} \subseteq \mathbb{C}$ est le groupe à deux éléments formé
de l'identité sur $\mathbb{C}$ et de la conjugaison complexe ; le
groupe de Galois de $\mathbb{F}_p \subseteq \mathbb{F}_{p^d}$ est le
groupe cyclique à $d$ éléments formé des $\Frob_p^i$ pour $0\leq i\leq
d-1$.
\bigbreak
On admet le théorème suivant, qui récapitule les résultats essentiels
de la théorie de Galois :
\begin{thm}\label{main-results-galois-theory}
Soit $K \subseteq L$ une extension galoisienne et $G := \Gal(K
\subseteq L)$ son groupe de Galois. Alors :
\begin{itemize}
\item si $K \subseteq L$ est finie, alors le groupe de Galois $G$ est
fini et son ordre $\#G$ est égal au degré $[L:K]$ de l'extension ;
d'autre part,
\item si $x \in L$ est fixé par tous les éléments du groupe de Galois
$G$, alors $x$ appartient à $K$ (la réciproque fait partie de la
définition même de $G$).
\end{itemize}
De plus, si on appelle $\Phi \colon E \mapsto \Gal(E \subseteq L)$ qui
à un corps intermédiaire $K \subseteq E \subseteq L$ associe le groupe
de Galois de l'extension $E \subseteq L$ (automatiquement
galoisienne), vu comme sous-groupe de $G$, on a
les résultats suivants :
\begin{itemize}
\item $\Phi$ est une injection (décroissante pour l'inclusion), de
l'ensemble des corps intermédiaires $K \subseteq E \subseteq L$ dans
l'ensemble des sous-groupes de $G$,
\item un inverse à gauche en est fourni par $H \mapsto \Fix(H) := \{x
\in L : \forall \sigma\in H\penalty-100\; (\sigma(x) = x)\}$,
\item si $K \subseteq L$ est finie, $\Phi$ est une bijection (en
général, $\Phi$ a pour image l'ensemble des sous-groupes « fermés »
pour une certaine topologie),
\item $\Phi(E)$ est distingué dans $G$ si et seulement si $K \subseteq
E$ est galoisienne, et si c'est le cas $\Gal(K \subseteq E)$ est le
quotient de $G = \Gal(K \subseteq L)$ par $\Phi(E) = \Gal(E
\subseteq L)$,
\item $\Phi(E_1.E_2)$ est l'intersection de $\Phi(E_1)$ et de
$\Phi(E_2)$, et, si $K \subseteq L$ est finie, $\Phi(E_1\cap E_2)$
est le sous-groupe de $G$ engendré par $\Phi(E_1)$ et $\Phi(E_2)$
(en général, il s'agit de l'« adhérence » du sous-groupe qu'ils
engendrent).
\end{itemize}
\end{thm}
\thingy\label{rational-is-stable-under-galois}
La partie la plus importante du résultat ci-dessus est la
suivante : \emph{si un élément de $L$ (séparable et normal sur $K$)
est fixé par le groupe $G$ de tous les $K$-automorphismes de $L$,
alors cet élément appartient à $K$}. Il s'agit donc d'une
généralisation du fait qu'un complexe stable par conjugaison complexe
est réel, et qu'un élément d'un corps fini stable par $\Frob_p \colon
x \mapsto x^p$ appartient à $\mathbb{F}_p$.
Une des applications de la théorie de Galois est de montrer que
certains objets définis \textit{a priori} sur un « gros » corps $L$
(par exemple la clôture séparable $K^{\sep}$ de $K$) sont, en fait,
définis sur le « petit » corps $K$. Le slogan général s'énonce sous
la forme
\begin{center}
rationnel = stable par Galois
\end{center}
où « rationnel », dans ce contexte, signifie que l'objet est défini
sur le « petit » corps $K$, et « stable par Galois » signifie que le
groupe de Galois fixe l'objet considéré (pour une certaine action
provenant de l'action naturelle sur $L$ : par exemple, pour un
polynôme, l'action sur les coefficients du polynôme).
\thingy\label{galois-group-of-polynomial-and-permutations}
Le groupe de Galois d'un polynôme séparable $f$ sur un corps
$K$ est le groupe de Galois $G$ du corps de décomposition
(cf. \ref{definition-decomposition-field}) $L$ de $f$ : il s'agit bien
d'une extension galoisienne, et par ailleurs, tout $\sigma \in G$ doit
envoyer une racine de $f$ sur une racine de $f$ (puisque $\sigma(f(x))
= f(\sigma(x))$ vu que $f \in K[t]$), donc permute les racines de $f$,
et en fait $\sigma$ est complètement déterminé par cette permutation
(puisque $L$ est engendré par les racines de $f$, un automorphisme de
$L$ est déterminé par son action sur les racines en question). On
peut donc dire : \emph{le groupe de Galois d'un polynôme séparable $f$
sur un corps $K$ est le groupe des permutations des racines de $f$
qui définissent un automorphisme du corps de décomposition}.
On peut montrer que la formulation suivante, peut-être plus intuitive,
est encore équivalente : le groupe de Galois de $f$ (séparable
sur $K$) est le groupe de toutes les permutations $\sigma$ des racines
$x_1,\ldots,x_n$ de $f$ (dans son corps de décomposition sur $K$)
telles que si $h(t_1,\ldots,t_n) \in K[t_1,\ldots,t_n]$ est une
quelconque « relation algébrique » entre les racines définie sur $K$,
autrement dit, vérifie $h(x_1,\ldots,x_n) = 0$, alors on a encore
$h(\sigma(x_1),\ldots,\sigma(x_n)) = 0$.
Une telle permutation doit certainement préserver la décomposition de
$f$ en facteurs irréductibles sur $K$ (i.e., envoyer une racine d'un
facteur irréductible sur une racine du même), et d'après
\ref{existence-uniqueness-decomposition-field}(2b) il opère
\emph{transitivement} sur les racines de n'importe quel facteur
irréductible, mais il n'est pas forcément évident de comprendre en
quoi toute permutation n'est pas forcément possible au sein des
racines d'un même polynôme irréductible, et il n'est pas non plus
évident de \emph{calculer} effectivement un groupe de Galois.
A minima, on retiendra que, pour $L$ galoisienne sur $K$, les
\emph{orbites} de $L$ sous l'action du groupe de Galois $G :=
\Gal(K\subseteq L)$ (c'est-à-dire les $\{\sigma(x) : \sigma\in G\}$
pour $x \in L$) sont exactement les classes d'équivalence pour la
relation « être conjugués sur $K$ »
(cf. \ref{definition-conjugate-elements}) ; ou, si on préfère, on a
une bijection entre l'ensemble des polynômes unitaires irréductibles
sur $K$ qui se scindent dans $L$ et l'ensemble $L/G$ des orbites de
$L$ sous $G$, la bijection envoyant $f$ sur l'ensemble de ses racines
dans $L$.
\thingy Dans beaucoup de cas, le groupe de Galois d'un polynôme $f \in
K[t]$ irréductible séparable de degré $n$ est égal au groupe
$\mathfrak{S}_n$ de toutes les permutations des racines de $f$ (ceci
se produit, bien sûr, exactement quand le corps de décomposition
de $f$ a pour degré $n!$ sur $K$).
Un exemple où ceci se produit est le polynôme $t^3 - 2$
sur $\mathbb{Q}$ dont le corps de décomposition est
$\mathbb{Q}(\zeta,\sqrt[3]{2})$ (où $\zeta$ est racine primitive
cubique de l'unité) qui a degré $6$ sur $\mathbb{Q}$ : toutes les
permutations des racines $\sqrt[3]{2},\zeta\sqrt[3]{2},\zeta^2
\sqrt[3]{2}$ est possible (i.e., définit un automorphisme du corps de
décomposition).
Un exemple où ceci \emph{ne} se produit \emph{pas} est le polynôme
$t^4 + t^3 + t^2 + t + 1$ sur $\mathbb{Q}$ dont les racines sont les
racines primitives cinquièmes de l'unité : ici le corps de
décomposition est égal au corps de rupture car dès qu'on a une racine
$\zeta$ les autres sont de la forme $\zeta^i$ — cette même remarque
prouve qu'un élément du groupe de Galois est déterminé par l'image de
la seule racine $\zeta$, et on peut se convaincre que le groupe est
exactement $(\mathbb{Z}/5\mathbb{Z})^\times \cong
\mathbb{Z}/4\mathbb{Z}$.
\bigbreak
Terminons cette section par deux résultats dus à Emil Artin :
\begin{thm}\label{artin-theorem-on-automorphisms}
Soit $L$ un corps et $G$ un groupe \emph{fini} d'automorphismes
de $L$ : si $K := \Fix_L(G) := \{x \in L : \forall \sigma\in
G\penalty-100\; (\sigma(x) = x)\}$ est le corps des éléments de $L$
fixés par tous les éléments de $G$, alors $K \subseteq L$ est une
extension galoisienne de groupe de Galois $G$ (en particulier, $[L:K]
= \#G$).
\end{thm}
\begin{proof}
Soit $x \in L$ et $\sigma_1,\ldots,\sigma_r \in G$ un ensemble
d'éléments de $G$ tels que les $\sigma_i(x)$ soient toutes les images
de $x$ par les éléments de $x$ chacune comptée exactement une fois.
En particulier, si $\tau\in G$ alors
$\tau\sigma_1(x),\ldots,\tau\sigma_r(x)$ sont une permutation de
$\sigma_1(x),\ldots,\sigma_r(x)$. Par conséquent, $\tau$ permute les
racines du polynôme $f(t) := \prod_{i=1}^r (t-\sigma_i(x))$, donc fixe
ses coefficients, c'est-à-dire que $f \in K[t]$ ; et comme les
$\sigma_i(x)$ sont distincts dans $L$, le polynôme $f$ est séparable ;
enfin, le degré de $f$ est $r \leq n := \#G$.
On a donc montré que tout élément $x$ de $L$ est racine d'un polynôme
sur $K$ séparable de degré $\leq n := \#G$ et scindé sur $L$. Ceci
montre que $L$ est algébrique séparable et normale sur $K$, et même,
que $[L:K] \leq n$ (car pour tous $x_1,\ldots,x_m \in L$ on a
$K(x_1,\ldots,x_m) = K(x)$ pour un certain $x$
d'après \ref{primitive-element-theorem}, donc on vient de voir que le
degré de $K(x_1,\ldots,x_m)$ sur $K$ est $\leq n$, et comme ceci est
vrai pour tous $x_1,\ldots,x_m$, on a $[L:K] \leq n$). On a donc
affaire à une extension $K \subseteq L$ galoisienne de degré $\leq
n$ ; d'après \ref{main-results-galois-theory}, le groupe des
$K$-automorphismes de $L$, ou groupe de Galois de $K \subseteq L$, a
pour cardinal exactement $[L:K] \leq n$, et comme on a déjà $\#G = n$
automorphismes, tous ces nombres sont égaux, et $G = \Gal(K \subseteq
L)$.
\end{proof}
\thingy L'intérêt du résultat ci-dessus est de construire des
extensions galoisiennes d'intérêt géométrique.
Un exemple important est celui de l'action du groupe $\mathfrak{S}_n$
des permutations des indéterminées $t_1,\ldots,t_n$ sur le corps $L =
k(t_1,\ldots,t_n)$ des fractions rationnelles en $n$ indéterminées sur
un corps $k$ : si on appelle $K = \Fix_L(\mathfrak{S}_n)$ le corps des
fractions rationnelles fixes par toutes les permutations des
indéterminées, alors le théorème \ref{artin-theorem-on-automorphisms}
assure que $K\subseteq L$ est galoisienne de groupe $\mathfrak{S}_n$
et en particulier $[L:K] = n!$ ; il est par ailleurs bien connu que
$K$ est une extension \emph{transcendante pure} de $k$ engendrée par
les polynômes symétriques élémentaires $e_r := \sum_{i_1<\cdots1$ en $n=1$ variable se
factorise dans $k^{\alg}$). Lorsque ceci \emph{ne} se produit
\emph{pas}, on dit que le polynôme est \defin{géométriquement
irréductible} ou \defin{absolument irréductible}. Plus
précisément :
\begin{itemize}
\item Un polynôme $f \in k[t_1,\ldots,t_n]$ est dit géométriquement
(ou absolument) irréductible lorsque $f$ est irréductible dans
$k^{\alg}[t_1,\ldots,t_n]$. Ceci implique, évidemment, qu'il est
irréductible. En $n=1$ variable, les seuls polynômes
géométriquement irréductibles sont ceux de degré $1$.
\item Un fermé de Zariski $Z(I)$ avec $I$ idéal radical de
$k[t_1,\ldots,t_n]$ est dit géométriquement (ou absolument)
irréductible lorsque l'idéal $I.k^{\alg}$ engendré par $I$ (comme
$k^{\alg}$-espace vectoriel ou comme idéal, cela revient au même,
cf. \ref{change-of-coefficients-on-polynomial-ideals}) dans
$k^{\alg}[t_1,\ldots,t_n]$ est premier. Notamment, si $I = (f)$ est
principal (engendré par un unique polynôme), cela signifie
exactement que $f$ est soit nul soit géométriquement irréductible.
\end{itemize}
(On renvoie à \ref{example-curve-irreducible-but-not-geometrically}
pour un exemple illustrant ces notions.)
\subsection{Extension des scalaires des algèbres sur un corps}
\thingy Soit $k \subseteq k'$ une extension de corps et $A$ une
$k$-algèbre : on voudrait associer à $A$ une $k'$-algèbre $A'$ obtenue
en « étendant les scalaires » de $k$ à $k'$ (les « scalaires », dans
cette expression, sont les éléments de $k$).
\thingy Soit $k \subseteq k'$ une extension de corps et $V$ un
$k$-espace vectoriel. Soit $(e_i)_{i\in I}$ une base de $V$ et $V'$
le $k'$-espace vectoriel de base $(e_i)_{i\in I}$ (c'est-à-dire
l'ensemble des combinaisons linéaires formelles $\sum_{i\in I}
\lambda_i e_i$ avec $\lambda_i \in k'$ tous nuls sauf un nombre fini).
On a une application $k$-linéaire $V \to V'$ « naturelle » qui envoie
$e_i$ sur $e_i$ (donc $\sum_{i\in I} \lambda_i e_i$ avec $\lambda_i
\in k$ sur la même somme où les $\lambda_i$ sont maintenant considérés
dans $k'$) ; cette application est, bien entendue, injective, et son
image engendre $V'$ comme $k'$-espace vectoriel (puisqu'elle contient
les $e_i$). Appelons-la $\iota\colon V \to V'$.
Alors, quel que soit le $k'$-espace vectoriel $W$, toute application
$k$-linéaire $u\colon V \to W$ se factorise de façon unique à
travers $\iota$, c'est-à-dire qu'il existe une unique application
\underline{$k'$-linéaire} $u'\colon V'\to W$ telle que $u =
u'\circ\iota$. Ou, si on préfère, l'application $\Hom_{k'}(V',W) \to
\Hom_k(V,W)$ de composition à droite par $\iota$, qui à une
application $k'$-linéaire $u'\colon V' \to W$ associe l'application
$k$-linéaire $u\colon V \to W$ donnée par $u\circ\iota$, est une
bijection. Il suffit pour s'en convaincre de se rappeler que
$\Hom_k(V,W)$ et $\Hom_{k'}(V',W)$ peuvent tous les deux s'identifier
à $W^I$ (l'ensemble des fonctions de $I$ dans $W$) grâce au choix de
la base $(e_i)_{i\in I}$ : autrement dit, on doit poser $u'(e_i) =
u(e_i)$, et ceci construit bien $u'$. On pourra dire qu'il s'agit là
d'une « propriété universelle » de $V'$.
En particulier, \emph{la construction effectuée de $V'$ ne dépend pas
du choix de la base} : si on construit $V'_1$ et $V'_2$ en utilisant
deux bases différentes de $V$, non seulement on obtient deux espaces
vectoriels isomorphes, mais il y a un \emph{unique} isomorphisme entre
eux qui soit compatible avec les applications $\iota_1\colon V\to
V'_1$ et $\iota_2\colon V\to V'_2$ construites en même temps.
Cet espace $V'$ s'appelle l'\defin{extension des scalaires} de $V$ de
$k$ à $k'$ et se note $V \otimes_k k'$. Sa dimension sur $k'$ est,
par contruction, égale à la dimension de $V$ sur $k$. On notera
$x\otimes 1$ l'élément $\iota(x)$ défini ci-dessus (dont les
coordonnées sur la base $e_i$ sont celles de $x$), et plus
généralement $x\otimes c$ pour $c\in k'$ l'élément $c\iota(x)$ dont
les coordonnées sur la base $e_i$ sont celles de $x$ multipliées
par $c$.
\thingy La « propriété universelle » de $\iota$ permet d'associer à
une application $k$-linéaire $u\colon V \to W$ entre $k$-espaces
vectoriels une application $k'$-linéaire $u'\colon V' \to W'$ entre
leurs extensions des scalaires $V' := V\otimes_k k'$ et $W' :=
W\otimes_k k'$. À savoir : on considère $\iota_W \circ u$ (où
$\iota_W \colon W\to W'$ est $x \mapsto x\otimes 1$ pour $x\in W$) et
la propriété universelle de $\iota_V$ assure qu'on peut l'écrire de
façon unique sous la forme $u' \circ \iota_V$. On dira que $u'$ est
obtenu à partir de $u$ par « extension des scalaires » de $k$ à $k'$
(ou par « fonctorialité »). Concrètement, $u'$ est définie par la
même matrice que $u$ (ou, si on veut éviter de parler de matrices
possiblement infinies, les mêmes coefficients sur des bases).
La même propriété universelle de $\iota$ vaut encore pour les
applications bilinéaires, et plus généralement, multilinéaires : si
$V_1,V_2$ sont deux $k$-espaces vectoriels et $V'_1 := V_1 \otimes_k
k'$ et $V'_2 := V_2 \otimes_k k'$ sont obtenus par extension des
scalaires, alors pour tout $k'$-espace vectoriel $W$, toute
application $k$-bilinéaire $b\colon V_1 \times V_2 \to W$ se factorise
de façon unique sous la forme $b(x_1,x_2) = b'(\iota(x_1),\iota(x_2))$
(c'est-à-dire $b'(x_1\otimes 1, x_2\otimes 1)$) avec $b'\colon V'_1
\times V'_2 \to W$ qui soit $k'$-bilinéaire (la démonstration est la
même : les applications $k$-bilinéaires $V_1 \times V_2 \to W$ ou
$k'$-bilinéaires $V'_1 \times V'_2 \to W$ sont en bijection avec
$W^{I_1\times I_2}$ une fois choisies des bases $(e_i)_{i\in I_1}$ et
$(f_j)_{j\in I_2}$ de $V_1$ et $V_2$). La même chose vaut encore avec
trois espaces vectoriels ou plus.
\thingy On a défini $V\otimes_k k'$ comme le $k'$-espace vectoriel
dont une base (sur $k'$, donc) est donnée par une base $(e_i)_{i\in
I}$ de $V$ (sur $k$). Il n'est bien entendu pas interdit de
considérer $V\otimes_k k'$ comme un espace vectoriel
\underline{sur $k$} : dans ce cas, une base en est donnée par les
$(e_i \otimes b_j)_{(i,j) \in I\times J}$ avec $(b_j)_{j\in J}$ une
base de $k'$ comme $k$-espace vectoriel (on s'en convainc en écrivant
un élément quelconque comme combinaison $k'$-linéaire de la
base $(e_i)_{i\in I}$ et en écrivant ensuite les coefficients
eux-mêmes comme combinaisons $k$-linéaires des $b_j$ ; de façon plus
générale, si $E$ est un $k'$-espace vectoriel et toujours $(b_j)_{j\in
J}$ une base de $k'$ comme $k$-espace vectoriel, alors une base de
$E$ comme $k$-espace vectoriel est donnée par les $(b_j e_i)_{(i,j)\in
I\times J}$).
Soulignons au passage qu'\emph{il n'est pas vrai que tous les éléments
de $V \otimes_k k'$ soient de la forme $x\otimes c$} pour $x\in V$
et $c\in k'$ : il est seulement vrai que ces éléments
\emph{engendrent} $V\otimes_k k'$ comme $k$-espace vectoriel.
Signalons de plus, sans plus développer, que l'extension des scalaires
qu'on a définie ci-dessus fait partie d'une construction plus générale
appelée \index{tensoriel (produit)}\defin{produit tensoriel}. Le
produit tensoriel de deux espaces vectoriels $V$ et $W$ sur un
corps $k$ est l'espace vectoriel $V\otimes_k W$ dont une base est le
produit d'une base de $V$ et d'une base de $W$ (on vient d'expliquer
pourquoi on est dans ce cas) ; on a une application bilinéaire
$\beta\colon V \times W \to V\otimes_k W$ qui envoie un couple
d'éléments des deux bases sur l'élément de la base d'arrivée défini
par ce même couple (dans le cas qu'on a considéré, $\beta(x,c) =
c\iota(x)$). Cette application bilinéaire possède la propriété
« universelle » que toute application $k$-bilinéaire $V\times W \to E$
se factorise de façon unique en la composée de $\beta$ et d'une
application $k$-linéaire $V\otimes_k W \to E$ : autrement dit, une
application $k$-bilinéaire $V\times W \to E$ et une application
$k$-linéaire $V\otimes_k W \to E$ sont essentiellement « la même
chose ». Cette même propriété permet de définir de façon plus
générale le produit tensoriel de deux modules quelconques sur un
anneau quelconque, mais nous ne le ferons pas.
\begin{prop}[« exactitude » de l'extension des scalaires sur un corps]\label{exactness-of-tensor-product-over-a-field}
Soit $k \subseteq k'$ une extension de corps et $U \subseteq V$ un
sous-$k$-espace vectoriel d'un $k$-espace vectoriel $V$ dont le
quotient sera noté $W := V/U$. Notons $U',V',W'$ les extensions des
scalaires de $U,V,W$ de $k$ à $k'$, et $U'\to V'$ et $V'\to W'$ les
applications $k'$-linéaires obtenues par extension des scalaires à
partir de l'injection d'inclusion (i.e., l'identité) $U\to V$ et la
surjection canonique $V\to W$. Alors (a) $V'\to W'$ est surjective,
(b) son noyau est exactement l'image de $U'\to V'$ et (c) cette
dernière est injective. (\textbf{Note :} l'affirmation (c) ici dépend
crucialement du fait que $k$ est un corps.)
\end{prop}
\begin{proof}
Soit $(e_i)_{i\in I}$ une base de $U$, qu'on complète en une base
de $V$, disons $(e_i)_{i\in I\cup J}$ (avec $I\cap J=\varnothing$),
l'image des $(e_i)_{i\in J}$ définissant alors une base de $W$. Ces
$k$-bases de $U,V,W$ donnent $k'$-bases de $U',V',W'$. Les
applications $U'\to V'$ et $V'\to W'$ s'obtiennent alors
respectivement en envoyant $e_i$ sur $e_i$ si $i\in I$ pour la
première, et pour la seconde en envoyant $e_i$ sur $\bar e_i$ si $i\in
J$ et $0$ si $i\in I$ : avec cette description, les affirmations (a),
(b) et (c) sont triviales.
\end{proof}
\thingy Supposons maintenant, toujours que $k\subseteq k'$ est une
extension de corps, mais maintenant que $A$ est une $k$-algèbre. On a
défini un $k'$-espace vectoriel $A' := A\otimes_k k'$ par « extension
des scalaires » de $k$ à $k'$. L'application $k$-bilinéaire $A
\times A \to A$ de multiplication (envoyant $(a,b)$ sur $ab$),
composée avec $\iota\colon A\to A'$, se factorise de façon unique
d'après la « propriété universelle » pour les applications bilinéaires
qu'on a vue plus haut : il existe donc une unique multiplication
$k'$-bilinéaire sur $A'$ qui vérifie $\iota(a)\,\iota(b) = \iota(ab)$.
L'associativité de $A$ donne l'associativité de $A'$ (puisque
l'application trilinéaire $(a,b,c) \mapsto a(bc)-(ab)c$ est nulle, son
unique factorisation par $\iota$ l'est encore).
Concrètement, cette algèbre $A' = A\otimes_k k'$ peut être construite
ainsi : on part d'une base $(e_i)_{i\in I}$ de $A$, on écrit chaque
produit $e_{i_1} e_{i_2}$ sous la forme $e_{i_1} e_{i_2} = \sum_{j\in
I} c_{i_1,i_2,j} e_j$ (les $c_{i_1,i_2,j}$ s'appellent les
« constantes de structure » de $A$ sur cette base), et l'algèbre $A'$
est la $k'$-algèbre obtenue en reprenant ces mêmes relations mais sur
un $k'$-espace vectoriel de base $(e_i)_{i\in I}$. Pour une algèbre
de type fini, on verra une description encore plus simple ci-dessous.
On a par ailleurs toujours la « propriété universelle » suivante : si
$B$ est une $k'$-algèbre, alors tout morphisme $\psi\colon A\to B$ de
$k$-algèbres (c'est-à-dire $k$-linéaire préservant le produit) se
factorise de façon unique comme la composée de $\iota A\to A'$ par un
morphisme de $k'$-algèbres $\psi'\colon A'\to B$ (comme on a déjà vu
la factorisation unique pour des morphismes d'espaces vectoriels, il
n'y a plus qu'à vérifier que $\psi'\colon A'\to B$ préserve la
multiplication, ce qui résulte du fait que $\psi(ab) -
\psi(a)\,\psi(b)$ est nulle donc son unique factorisation par $\iota$
l'est aussi).
\thingy Si $k\subseteq k'$ est toujours une extension de corps et si
maintenant $A = k[t_1,\ldots,t_d]/I$ alors on peut décrire $A' :=
A\otimes_k k'$ comme $k'[t_1,\ldots,t_d]/I'$ où $I'$ est l'idéal
engendré par $I$ dans $k'[t_1,\ldots,t_d]$, qui est aussi le
$k'$-espace vectoriel engendré par $I$
d'après \ref{change-of-coefficients-on-polynomial-ideals}. En effet,
le cas où $I=0$, c'est-à-dire quand $A = k[t_1,\ldots,t_d]$, est
clair, puisque les monômes forment une base sur $k$ de
$k[t_1,\ldots,t_d]$ et une base sur $k'$ de $k'[t_1,\ldots,t_d]$, avec
la même multiplication, et la
proposition \ref{exactness-of-tensor-product-over-a-field} permet d'en
déduire le cas général (l'affirmation (c) montre que $I' = I\otimes_k
k'$, l'affirmation (a) montre que $k'[t_1,\ldots,t_d] \to
(k[t_1,\ldots,t_d]/I)\otimes_k k'$ est surjective et l'affirmation (b)
montre que son noyau est précisément $I'$).
Autrement dit, concrètement, si $h_1,\ldots,h_m \in k[t_1,\ldots,t_d]$
et si $A = k[t_1,\ldots,t_d]/(h_1,\ldots,h_m)$ (ce qui est la
structure générale d'une algèbre de type fini sur $k$ d'après
\ref{subalgebra-generated-is-polynomials} et
\ref{hilbert-basis-theorem-for-polynomials}), on a $A\otimes_k k' =
k'[t_1,\ldots,t_d]/(h_1,\ldots,h_m)$. Ce qui n'était pas évident
\textit{a priori} sur cette écriture, mais qui résulte de ce qu'on a
fait ci-dessus, est que, à isomorphisme près, cette définition ne
dépend pas de la « présentation » de $A$ comme
$k[t_1,\ldots,t_d]/(h_1,\ldots,h_m)$ (c'est-à-dire du choix des
générateurs, les images des $t_i$, et des relations entre eux,
c'est-à-dire les $h_i$).
À titre d'exemple, $\mathbb{C} = \mathbb{R}[t]/(t^2+1)$ donc
$\mathbb{C}\otimes_\mathbb{R}\mathbb{C} = \mathbb{C}[t]/(t^2+1) =
\mathbb{C}[t]/((t+\sqrt{-1})(t-\sqrt{-1})) \cong
\mathbb{C}\times\mathbb{C}$ (cet exemple montre qu'étendre les
scalaires d'un corps ne donne pas forcément un corps, ni même un
anneau intègre — on va justement réexpliquer ce phénomène au
paragraphe suivant).
\thingy\label{reinterpretation-of-linear-disjointness} La définition
de l'extension des scalaires permet de reconsidérer la notion
d'extensions de corps linéairement disjointes introduite
en \ref{section-linear-disjointness} ainsi que l'ensemble des
résultats de cette section :
La proposition \ref{linear-disjointness-with-basis} signifie que deux
extensions de corps $k \subseteq K$ et $k \subseteq L$ contenues dans
une même troisième $M$ sont linéairement disjointes \emph{si et
seulement si} le morphisme $K \otimes_k L \to M$ (application
$L$-linéaire déduite de la factorisation de l'application $K$-linéaire
$K \to M$ en utilisant la propriété universelle) est injective. La
proposition \ref{compositum-generated-by-products} signifie que
lorsque $L$ est algébrique sur $k$, l'extension composée $K.L$ est
simplement l'image de cette application $K \otimes_k L \to M$. La
proposition \ref{base-of-compositum} en conclut que, toujours avec $L$
algébrique sur $k$, on a $K$ et $L$ sont linéairement disjointes
au-dessus de $k$ si et seulement si $K.L = K\otimes_k L$, ou si on
préfère, si et seulement si $K\otimes_k L$ est un corps (observer que
si $K\otimes_k L$ est un corps, le morphisme $K \otimes_k L \to M$ est
forcément injectif).
La
proposition \ref{linear-disjointness-of-algebraic-and-transcendental}
signifie (en changeant les notations) que \emph{lorsque $k'$ est
algébrique sur $k$} on a $k(t_1,\ldots,t_d) \otimes_k k' =
k'(t_1,\ldots,t_d)$, à comparer avec $k[t_1,\ldots,t_d] \otimes_k k' =
k'[t_1,\ldots,t_d]$ vu ci-dessus et valable sans hypothèse sur
l'extension $k \subseteq k'$. (Pour montrer que la restriction sur
$k'$ est vraiment pertinente dans le cas des fractions rationnelles,
signalons que $k(x) \otimes_k k(y)$, si $x,y$ sont deux indéterminées,
est le sous-anneau de $k(x,y)$ formé des fractions rationnelles qui
admettent un dénominateur produit d'un polynôme en $x$ et d'un
polynôme en $y$.) Voici une généralisation de ce fait :
\begin{prop}\label{field-of-fractions-versus-change-of-scalars}
Soit $k$ un corps et $A$ une $k$-algèbre, et soit $k'$ une extension
algébrique de $k$. Supposons que $A \otimes_k k'$ soit \emph{intègre}
(en particulier, $A$ lui-même est intègre). Alors son corps des
fractions $\Frac(A \otimes_k k')$ s'identifie avec $\Frac(A) \otimes_k
k'$. De plus, dans ces conditions, $\Frac(A)$ et $k'$ sont
linéairement disjointes comme extensions de $k$ contenues dans
$\Frac(A \otimes_k k')$, et ce dernier est leur composé.
\end{prop}
\begin{proof}
Le fait que $A$ soit intègre si $A \otimes_k k'$ l'est résulte du fait
que si $aa' = 0$ dans $A$ alors $(a\otimes 1)(a'\otimes 1) =
(aa')\otimes 1 = 0$, or $a\otimes 1$ n'est nul que pour $a=0$.
Soit maintenant $K' := \Frac(A \otimes_k k')$. D'après
\ref{exactness-of-tensor-product-over-a-field}(c), on peut voir $A
\otimes_k k'$ comme une sous-$k'$-algèbre de $K'$ (à savoir le
$k'$-espace vectoriel engendré par les $a\otimes 1$ pour $a\in A$).
Notamment, on peut voir $A$ (identifié à l'ensemble des $a\otimes 1$)
comme une sous-$k$-algèbre de $K'$, et $k'$ (identifié à l'ensemble
des $1\otimes u$ pour $u\in k'$) comme un sous-corps de $K'$, contenu
dans $A\otimes_k k'$. Puisque $A$ est contenu dans le corps $K'$, il
en va de même de son corps des fractions $K := \Frac(A)$. On veut
montrer que $K \otimes_k k' = K'$ : pour cela, d'après ce qui a été
dit ci-dessus (et comme $k'$ est algébrique sur $k$), il s'agit de
prouver que $K$ et $k'$ sont linéairement disjointes comme extensions
de $k$ contenues dans $K'$ et que leur composée est $K'$.
Le fait que l'extension composée soit $K'$ est clair car $K'$ est
engendré en tant que corps par $A$ et $k'$, donc \textit{a fortiori}
par $K$ et $k'$. Il reste à voir que $K$ et $k'$ sont linéairement
disjointes, autrement dit, que si les $u_j$ sont des éléments de $k'$
linéairement indépendants sur $k$ et les $c_j$ des éléments de $K$
tels que $\sum_j c_j u_j = 0$ dans $K'$, alors en fait les $c_j$ sont
nuls.
Mais on peut écrire $c_j = a_j/q$ où $a_j \in A$ et $q \in A$ est non
nul fixé. On a donc $\sum_j a_j u_j = 0$ dans $K'$, et en fait
l'élément $a_j u_j$ de $K'$ s'identifie à l'élément $a_j \otimes u_j$
de $A \otimes_k k'$ comme on vient de l'expliquer. Mais vu que les
$u_j$ sont linéairement indépendants sur $k$, cet élément ne peut être
nul que si tous les $a_j$ sont nuls (quitte, par exemple, à prendre
une base de $A$ sur $k$ et à compléter les $u_j$ en une base de $k'$
sur $k$).
(Le fait que $A\otimes_k k'$ soit intègre a servi, dans cette
démonstration, à tout situer dans le corps $K'$.)
\end{proof}
%
%
%
\section{Corps de courbes algébriques}
\subsection{Définition et premiers exemples}
\thingy\label{definition-function-field}
Soit $k$ un corps. On appelle \defin[fonctions (corps de)]{corps de fonctions de
dimension $n$} sur $k$ une extension de corps de $k$ qui soit de
type fini (cf. \ref{subfield-generated}) et de degré de
transcendance $n$ sur $k$ (cf. \ref{definition-transcendence-degree}).
Notamment, pour $n=1$, on parle de \defin[courbe (corps de fonctions)]{corps de fonctions de
courbe} sur $k$.
Par abus de langage, on dira parfois simplement que $K$ est une
« courbe » (algébrique) sur $k$ ; ou bien on dira que $K$ est le corps
des fonctions [rationnelles] de la courbe $C$ et on notera alors $K =
k(C)$ (on ne définit pas ce qu'« est » $C$, voir les exemples
ci-dessous).
\danger Il existe un certain nombre de variations entre auteurs autour
de cette définition, pour essentiellement deux raisons :
\textbf{(a)} le cadre dans lequel on considère les courbes n'est pas
forcément le même (dans ce cours, nous avons choisi de définir les
courbes à travers leur corps des fonctions, c'est-à-dire leurs
fonctions rationnelles, plutôt que leur \emph{anneau(x)} de fonctions
régulières, c'est-à-dire leurs fonctions polynomiales : l'avantage est
que cela simplifie l'étude ; l'inconvénient est que l'étude des
courbes singulières n'est pas possible : par exemple, la courbe
d'équation $y^2 = x^3$ dans le plan va simplement revenir à celle de
la droite qui la paramètre par $t \mapsto (x,y) = (t^2,t^3)$, et de
même on ne peut pas retirer des points à une courbe ; pour cette
raison, ce que nous appelons « courbe » s'appellerait « courbe normale
projective » ou « courbe projective lisse » chez d'autres auteurs),
et \textbf{(b)} les hypothèses effectuées ne sont pas forcément les
mêmes (notamment, beaucoup d'auteurs restreignent les courbes à ce
qu'on appellera plus bas les courbes « géométriquement irréductibles »).
On sera éventuellement amené à restreindre la définition qui vient
d'être donnée.
\thingy\label{function-field-of-the-line}
La courbe la plus simple est donnée par le corps $k(t)$ des
fractions rationnelles en une indéterminée $t$ (l'extension
\emph{transcendante pure} de degré de transcendance $1$) : on
l'appelle \defin{droite projective} (ou simplement « droite »)
sur $k$ et on peut la noter $\mathbb{P}^1_k$ ou simplement
$\mathbb{P}^1$ (ainsi, $k(\mathbb{P}^1_k) := k(t)$).
Il faut imaginer les éléments de $k(t)$ comme des fonctions
rationnelles sur la droite affine : on verra plus loin comment définir
les points de la droite, mais on peut au moins dire ceci : si $x$ est
un élément de $k$ ou bien le symbole spécial $\infty$, et si $f \in
k(t)$, on définit $f(x)$ comme l'\defin{évaluation} (=la valeur) de
$f$ en $x$ ou bien le symbole spécial $\infty$ si $f$ a un pôle en $x$
(lorsque $x = \infty$, l'évaluation de $f$ en $x$ peut se définir
comme celle de la fraction rationnelle $f(\frac{1}{t})$ en $0$ ; sur
les réels ou les complexes, c'est simplement la limite de $f$
en $\infty$ ou bien $\infty$ si $f$ n'est pas borné).
Rappelons que tout élément $f$ non nul de $k(t)$ possède une écriture
unique sous la forme $c \prod_{h \in \mathscr{P}} h(t)^{v_h}$ où $c
\in k^\times$, les $v_h$ sont des entiers (relatifs) tous nuls sauf un
nombre fini, et $\mathscr{P}$ est l'ensemble des polynômes unitaires
irréductibles dans $k[t]$. Si $k$ est \emph{parfait}, tout $h \in
\mathscr{P}$ peut encore s'écrire sous la forme $\prod_{\xi \in M}
(t-\xi)$ où $M$ est une orbite de $k$ sous $\Gamma_k := \Gal(k
\subseteq k^{\alg})$ (puisque deux éléments de $k$ sont conjugués si
et seulement si ils sont dans la même orbite sous $\Gamma_k$,
notamment d'après \ref{galois-group-of-polynomial-and-permutations}
ou \ref{existence-uniqueness-decomposition-field}(2b)). On peut donc
écrire tout élément non nul de $k(t)$ de façon unique sous la forme $c
\prod_{\xi \in k^{\alg}} (t-\xi)^{v_\xi}$ où $c \in k^\times$, les
$v_\xi$ sont des entiers (relatifs) tous nuls sauf un nombre fini, et
$v_\xi$ est invariant sous $\Gamma_k$ (i.e., $v_{\sigma(\xi)} = v_\xi$
pour tout $\sigma\in\Gamma_k$ et $\xi \in k^{\alg}$). Un des thèmes
de ce qui va suivre est de généraliser ce type d'écriture au corps des
fonctions d'une courbe quelconque : en attendant, signalons que $v_h$
ou $v_\xi$ s'appellera la \defin{valuation} en $h$ ou $\xi$ de la
fonction $f$ considérée, et on verra à partir
de \ref{valuation-ring-versus-valuation-function} en quoi ce genre de
fonction est important.
\thingy\label{function-field-of-a-plane-curve}
Si $P \in k[x,y]$ est un polynôme irréductible en deux
indéterminées $x,y$ et faisant effectivement intervenir $y$, on peut
le voir comme un élément de $k(x)[y]$, qui est encore irréductible
(cf. \ref{gauss-lemma-on-irreducibility}), ce qui définit donc un
corps de rupture $k(x)[y]/(P)$
(cf. \ref{monogeneous-extensions-dichotomy-bis}
et \ref{existence-uniqueness-rupture-field}) qu'on notera généralement
$k(x,y : P=0)$ ; c'est aussi le corps des fractions de $k[x,y]/(P)$
(puisque c'est un corps contenant $k[x,y]/(P)$ et engendré par lui),
et du coup, c'est aussi $k(y)[x]/(P)$ dès lors que la variable $x$
intervient effectivement.
On souhaite dire qu'il s'agit du corps de fonctions $k(C)$ de la
« courbe plane » $C := \{P=0\}$ : à ce stade-là, il s'agit d'une
notation purement formelle, mais on peut faire les remarques suivantes
pour l'éclaircir.
On a introduit en \ref{notation-zeros-of-polynomials} la notation
$Z(P) := \{(x,y) \in (k^{\alg})^2 : P(x,y) = 0\}$ pour l'ensemble des
zéros de $P$ (dans une clôture algébrique !) : appelons $C_P$ cet
ensemble. Comme $P$ est irréductible, l'idéal $(P)$ est premier
(cf. \ref{regular-elements-and-prime-ideals}), donc radical
(cf. \ref{radical-ideals}) : la
proposition \ref{zeros-and-ideals-bijections} implique donc que $(P)$
est l'idéal des polynômes qui s'annulent identiquement sur $C_P$, et
on a expliqué en \ref{regular-functions-on-a-zariski-closed-set} que
les éléments de $k[x,y]/(P)$ peuvent s'identifier aux fonctions
régulières sur $C_P$, c'est-à-dire les restrictions à $C_P$ des
éléments de $k[x,y]$ (vus comme des fonctions $(k^{\alg})^2 \to
k^{\alg}$). Le corps $k(C) = \Frac(k[x,y]/(P))$ dont on vient de
parler peut donc se voir comme l'ensemble des quotients de deux
fonctions régulières (i.e., polynomiales) sur $C_P$ dont le
dénominateur n'est pas identiquement nul sur $C_P$ : il est donc
raisonnable d'appeler ce corps « corps des fonctions sur $C_P$ ».
L'extension de corps $k(x) \subseteq k(C)$ (quand on voit $k(C)$ comme
$k(x)[y]/(P)$) correspondra à la projection $C \to \mathbb{P}^1$ sur
la première coordonnée.
Donnons quelques exemples plus précis, puis discutons ce qui se passe
dans des cas adjacents.
\thingy\label{example-curve-circle} Considérons l'exemple de $P = x^2
+ y^2 - 1$ sur un corps $k$ de caractéristique $\neq 2$ (on pensera
notamment au corps des réels).
Le polynôme $P$ est irréductible dans $k[x,y]$. En effet, comme il
est de degré total $2$, une factorisation non triviale serait
nécessairement en degrés $1+1$ ; en considérant les termes de plus
haut degré (i.e., $1$) des facteurs, dont le produit doit être $x^2 +
y^2$, on voit qu'ils doivent être de la forme $x+\sqrt{-1}\,y$ et
$x-\sqrt{-1}\,y$ (en notant $\sqrt{-1}$ une racine carrée de $-1$
dans $k$, qui doit exister pour que la factorisation soit possible) ;
or avoir $(x+\sqrt{-1}\,y+c)(x-\sqrt{-1}\,y+c') = x^2+y^2-1$ impose
simultanément $c+c' = 0$ et $c-c' = 0$ et $cc' = -1$, conditions
manifestement impossibles à satisfaire en caractéristique $\neq 2$.
On est donc dans le cadre considéré plus haut.
La courbe plane $C$ d'équation $P=0$ est le « cercle unité », dont le
corps des fonctions est le corps $\Frac(k[x,y]/(x^2+y^2-1)) = k(x,y :
x^2+y^2=1)$ de rupture de $x^2+y^2-1$ sur $k(x)$. En fait, il s'avère
que ce corps est \emph{isomorphe} au corps $k(t)$ des fractions
rationnelles en une indéterminée : ceci résulte du « paramétrage
rationnel du cercle » représenté géométriquement par la figure
suivante
\begin{center}
\begin{tikzpicture}[scale=3]
\draw[step=.2cm,help lines] (-1.25,-1.25) grid (1.25,1.25);
\draw[->] (-1.15,0) -- (1.15,0); \draw[->] (0,-1.15) -- (0,1.15);
\draw (0,0) circle (1cm);
\draw (1,-1.15) -- (1,1.15);
\coordinate (P) at (0.8,0.6);
\coordinate (Q) at (1,0.6666666667);
\draw (0.8,0) -- (P);
\draw (-1,0) -- node[sloped,auto] {$\scriptstyle\mathrm{pente}=t$} (Q);
\fill[black] (P) circle (.5pt);
\fill[black] (Q) circle (.5pt);
\fill[black] (-1,0) circle (.5pt);
\node[anchor=west] at (Q) {$\scriptstyle (1,2t)$};
\node[anchor=north east] at (-1,0) {$\scriptstyle (-1,0)$};
\node[anchor=north west] at (1,0) {$\scriptstyle (1,0)$};
\node[anchor=east] at (P) {$\scriptstyle (\frac{1-t^2}{1+t^2},\frac{2t}{1+t^2})$};
\end{tikzpicture}
\end{center}
Un petit calcul d'inspiration géométrique (cf. les formules exprimant
$(\cos\theta,\sin\theta)$ en fonction de $\tan\frac{\theta}{2}$),
valable en fait sur tout corps $k$ de caractéristique $\neq 2$, montre
que toute solution $(x,y)$ de $x^2+y^2=1$ autre que $(-1,0)$ peut
s'écrire de la forme $(\frac{1-t^2}{1+t^2},\frac{2t}{1+t^2})$ avec $t
\in k$ (uniquement défini, et vérifiant $t^2\neq -1$), qui peut être
réciproquement calculé comme $t = \frac{y}{x+1}$.
Mais ces mêmes formules peuvent s'interpréter comme définissant un
\emph{isomorphisme} entre $k(C) := k(x,y : x^2+y^2=1)$ et
$k(\mathbb{P}^1) = k(t)$, à savoir l'isomorphisme envoyant $x$ et $y$
(maintenant des éléments de $k(C)$) sur $\frac{1-t^2}{1+t^2}$ et
$\frac{2t}{1+t^2}$ (éléments de $k(t)$) respectivement : le fait qu'on
ait bien $\big(\frac{1-t^2}{1+t^2}\big)^2 +
\big(\frac{2t}{1+t^2}\big)^2 = 1$ assure que ce morphisme est bien
défini (rappel : pour définir un morphisme de $k(x)[y]/(P)$ vers un
anneau $B$ quelconque il suffit de définir un morphisme de $k(x)[y]$
vers $B$ qui annule l'image de $P$), et en vérifiant que $t \mapsto
\frac{y}{x+1}$ est sa réciproque, on voit que c'est un isomorphisme.
Toute cette situation se résume en disant que le cercle $C =
\{x^2+y^2=1\}$ est une courbe \defin[rationnelle (courbe)]{rationnelle} (sur le corps $k$
quelconque de caractéristique $\neq 2$), ou rationnellement
paramétrée. Le cadre dans lequel nous considérons les courbes fait
qu'on « ne voit pas » la différence entre les courbes rationnelles et
la droite. (Un exemple encore plus simple d'une courbe rationnelle
est fourni par la parabole $\{x = y^2\}$, rationnellement paramétrée
par $y$, c'est-à-dire qu'ici $k(x)[y]/(y^2-x)$ est simplement $k(y)$,
dans lequel $k(x)$ est vu comme le sous-corps $k(y^2)$.)
De façon générale, le même raisonnement que pour le cercle va
fonctionner pour une conique « non-dégénérée » sur un corps de
caractéristique $\neq 2$, i.e., la courbe définie par un polynôme de
degré $2$ qui ne se factorise pas même sur la clôture algébrique
(géométriquement, ceci signifie que la conique ne sera pas réunion de
deux droites, même sur la clôture algébrique), \emph{à condition
d'avoir un point rationnel}
(cf. \ref{rational-and-closed-points-of-zariski-closed-sets}(1)) qui
puisse jouer le rôle de $(-1,0)$ dans le paramétrage par des droites
de pente variable. L'exemple qui suit montre que cette hypothèse
n'est pas anecdotique.
\thingy Considérons maintenant l'exemple de $P = x^2 + y^2 + 1$ sur un
corps $k$ de caractéristique $\neq 2$ dans lequel $-1$ n'est pas somme
de deux carrés (de nouveau, on pensera principalement au corps des
réels). Le même argument que pour $x^2 + y^2 - 1$ montre que ce
polynôme $P$ est irréductible, mais cette fois $k(C) := k(x,y :
x^2+y^2=-1)$ \emph{n'est pas} isomorphe à $k(t)$. En effet, un tel
isomorphisme déterminerait deux éléments $x,y\in k(t)$ vérifiant
$x^2+y^2=-1$ ; mais quitte à chasser les dénominateurs on obtient
$x,y,z\in k[t]$ tels que $x^2+y^2+z^2=0$, et en prenant le
dénominateur réduit, $x,y,z$ ne s'annulent pas simultanément en $0$,
disons $z(0)\neq 0$ pour fixer les idées, et quitte à poser $u =
x(0)/z(0)$ et $v = y(0)/z(0)$ on obtient $u^2 + v^2 = -1$,
contredisant l'hypothèse faite sur $k$.
En particulier, $\mathbb{R}(x,y : x^2+y^2=-1)$ fournit un exemple
d'une extension de corps de $\mathbb{R}$ de type fini et de degré de
transcendance $1$ mais qui n'est pas trancendante pure.
La courbe décrite par cet exemple est ce qu'on appelle généralement
une « conique sans point(s) » (c'est-à-dire : sans point
\emph{rationnel}).
\thingy\label{examples-of-singular-rational-curves}
Mentionnons encore quelques exemples de courbes rationnelles
données par des fermés de Zariski ayant des points \emph{singuliers}.
On dit qu'un point (à coordonnées dans la clôture algébrique !) du
fermé de Zariski $\{P=0\}$ (avec $P \in k[x,y]$ non constant) est
\defin[singulier (point)]{singulier} lorsque $P'_x$ et $P'_y$ s'y annulent
simultanément.
\begin{itemize}
\item La courbe d'équation $y^2 = x^3 + x^2$ sur un corps de
caractéristique $\neq 2$. (Note : le polynôme $x^3 + x^2 - y$ est
irréductible car un facteur de degré $1$ serait de la forme $x - c$
en regardant les termes de plus haut degré, et on se convainc
facilement que cette courbe ne contient pas de droite verticale
$x=c$.) Cette courbe porte le nom standard de « \defin{cubique nodale} »,
et le point $(0,0)$ est y appelé un « point double ordinaire ».
(Formellement un point est un point double ordinaire de $\{P=0\}$
avec $P$ irréductible lorsque $P'_x$ et $P'_y$ s'y annulent mais que
le polynôme $P''_{x,x} + P''_{x,y} u + P''_{y,y} u^2$ — qui définit
les directions des tangentes — n'a pas de zéro multiple sur la
clôture algébrique.) On peut la paramétrer rationnellement en
utilisant $t$ la pente d'une droite variable par le point double
ordinaire $(0,0)$ et en cherchant les coordonnées de son autre point
d'intersection avec la courbe : en injectant $y = tx$ dans $y^2 =
x^3 + x^2$ on trouve le paramétrage $(x,y) = (t^2-1, t^3-t)$. On
remarquera que ce paramétrage parcourt deux fois le point $(0,0)$
(une fois pour $t=+1$ et une fois pour $t=-1$), essentiellement une
fois par direction tangente en ce point (les deux tangentes sont
$y=x$ et $y=-x$).
\begin{center}
\begin{tikzpicture}[scale=3]
\draw[step=.2cm,help lines] (-1.25,-1.25) grid (1.25,1.25);
\draw[->] (-1.15,0) -- (1.15,0); \draw[->] (0,-1.15) -- (0,1.15);
\draw (0.777778,-1.037037) .. controls (0.481481,-0.555556) and (0.222222,-0.222222) .. (0,0) ; % t from -4/3 to -1
\draw (0,0) .. controls (-0.666667,0.666667) and (-1,0.333333) .. (-1,0); % t from -1 to 0
\draw (-1,0) .. controls (-1,-0.333333) and (-0.666667,-0.666667) .. (0,0); % t from 0 to 1
\draw (0,0) .. controls (0.222222,0.222222) and (0.481481,0.555556) .. (0.777778,1.037037); % t from 1 to 4/3
\coordinate (P) at (-0.888889,-0.296296);
\draw (P) -- node[sloped,auto] {$\scriptstyle\mathrm{pente}=t$} (0,0);
\fill[black] (0,0) circle (.5pt);
\fill[black] (P) circle (.5pt);
\node[anchor=north west] at (0,0) {$\scriptstyle (0,0)$};
\node[anchor=east] at (P) {$\scriptscriptstyle (t^2-1,t^3-t)$};
\end{tikzpicture}
\end{center}
\bigskip
\item La courbe d'équation $y^2 = x^3 - x^2$ sur un corps de
caractéristique $\neq 2$ dans lequel $-1$ n'est pas un carré, par
exemple le corps des réels. (De nouveau, on vérifie que ce polynôme
est irréductible.) Le point $(0,0)$ est de nouveau un « point
double ordinaire », mais cette fois ses deux tangentes ne sont pas
rationnelles (« rationnelles » au sens « définies sur $k$ »). On
peut toujours paramétrer rationnellement la courbe utilisant $t$ la
pente d'une droite variable par le point double ordinaire $(0,0)$ et
en cherchant les coordonnées de son autre point d'intersection avec
la courbe : en injectant $y = tx$ dans $y^2 = x^3 - x^2$ on trouve
le paramétrage $(x,y) = (t^2+1, t^3+t)$. On remarquera que cette
fois le point $(0,0)$ est atteint par des coordonnées qui ne sont
pas dans $k$ (à savoir $\pm\sqrt{-1}$).
\begin{center}
\begin{tikzpicture}[scale=3]
\draw[step=.2cm,help lines] (-0.25,-1.25) grid (2.25,1.25);
\draw[->] (-0.15,0) -- (2.15,0); \draw[->] (0,-1.15) -- (0,1.15);
\draw (1.49,-1.043) .. controls (1.163333,-0.466667) and (1,-0.23333) .. (1,0); % t from -0.7 to 0
\draw (1,0) .. controls (1,0.23333) and (1.163333,0.466667) .. (1.49,1.043); % t from 0 to 0.7
\coordinate (P) at (1.111111,0.370370);
\draw (0,0) -- node[sloped,auto] {$\scriptstyle\mathrm{pente}=t$} (P);
\fill[black] (0,0) circle (.5pt);
\fill[black] (P) circle (.5pt);
\node[anchor=north west] at (0,0) {$\scriptstyle (0,0)$};
\node[anchor=west] at (P) {$\scriptscriptstyle (t^2+1,t^3+t)$};
\end{tikzpicture}
\end{center}
\bigskip
\item La courbe d'équation $y^2 = x^3$ (toujours irréductible). Cette
courbe porte le nom de « \defin{cubique cuspidale} » parce que le
point $(0,0)$ est un « cusp » ou point de rebroussement. Le même
procédé de paramétrage que ci-dessus donne $x = t^2$ et $y = t^3$
(par ailleurs trouvable directement). Cette fois-ci, il y a bien
bijection, sur n'importe quel corps $k$, entre les solutions de $y^2
= x^3$ et les éléments de $k$.
\begin{center}
\begin{tikzpicture}[scale=3]
\draw[step=.2cm,help lines] (-0.75,-1.25) grid (1.75,1.25);
\draw[->] (-0.65,0) -- (1.65,0); \draw[->] (0,-1.15) -- (0,1.15);
\draw (1,-1) .. controls (0.333333,0) and (0,0) .. (0,0); % t from -1 to 0
\draw (0,0) .. controls (0,0) and (0.333333,0) .. (1,1); % t from 0 to 1
\coordinate (P) at (0.64,0.512);
\draw (0,0) -- node[sloped,auto] {$\scriptstyle\mathrm{pente}=t$} (P);
\fill[black] (0,0) circle (.5pt);
\fill[black] (P) circle (.5pt);
\node[anchor=north east] at (0,0) {$\scriptstyle (0,0)$};
\node[anchor=north west] at (P) {$\scriptscriptstyle (t^2,t^3)$};
\end{tikzpicture}
\end{center}
\end{itemize}
Dans chacun de ces exemples, le corps $k(C)$ des fonctions de la
courbe est simplement le corps $k(t)$ (pour le paramétrage qu'on a
donné), mais le fermé de Zariski $\{P=0\}$ présente des complications
géométriques, et on pourrait se convaincre que l'anneau $k[x,y]/(P)$
des fonctions régulières sur $\{P=0\}$ \emph{n'est pas}
l'anneau $k[t]$ (bien qu'il ait $k(t)$ comme corps des fractions).
\thingy On a mentionné ci-dessus l'exemple de la parabole $\{x =
y^2\}$, courbe rationnelle dont le corps des fonctions
$k(x)[y]/(y^2-x)$ est simplement $k(y)$ à l'intérieur duquel $k(x)$
est vu comme le sous-corps $k(y^2)$. Plus généralement, on a la
courbe $\{x = y^n\}$, courbe rationnelle dont le corps des fonctions
$k(x)[y]/(y^n-x)$ est simplement le corps des fractions rationnelles
(=transcendant pur) $k(y)$ à l'intérieur duquel $k(x)$ (lui aussi
transcendant pur) est vu comme le sous-corps $k(y^n)$. Si $n$ n'est
pas multiplie de la caractéristique et que $k$ a une racine primitive
$n$-ième de l'unité $\zeta$, alors $y \mapsto \zeta y$ définit un
automorphisme de $k(y)$ dont le corps fixe est exactement $k(y^n) =
k(x)$. D'après le théorème \ref{artin-theorem-on-automorphisms}, ceci
implique que l'extension $k(y^n) \subseteq k(y)$ est galoisienne de
groupe de Galois $\mathbb{Z}/n\mathbb{Z}$, ou, mieux $\{\zeta^i\}$,
qu'on peut vraiment voir comme des transformations sur la courbe
(envoyant le point géométrique de coordonnées $(x,y)$ sur $(x,\zeta^i
y)$).
(Si $n$ est multiple de la caractéristique, l'extension $k(y^n)
\subseteq k(y)$ ne sera pas séparable, mais ça n'empêche pas $k(y)$
d'être un corps de fonctions d'une courbe tout à fait sympathique.)
En caractéristique $p>0$, un autre exemple important est celui de la
courbe d'équation $x = y^p - y$ : de nouveau, $k(x)[y]/(x-y^p+y)$ est
simplement $k(y)$ (transcendant pur) à l'intérieur duquel $k(x)$ se
plonge par $x \mapsto y^p - y$ ; cette fois, c'est $y \mapsto y+1$ qui
définit un automorphisme de $k(y)$ fixant exactement $k(x)$.
\thingy Lorsque $P \in k[x,y]$ n'est pas irréductible, disons $P =
P_1\,P_2$ avec $P_1,P_2$ non constants, alors $Z(P) = Z(P_1) \cup
Z(P_2)$ : autrement dit, on a affaire non pas à une seule courbe mais
à une réunion de courbes (certains auteurs appellent encore « courbe »
cet objet). Si on s'est placé dans le cadre où $(P)$ est radical,
alors $P_1,P_2$ sont premiers entre eux, car s'ils avaient un diviseur
commun $Q$ non-trivial, on aurait $P_1\,P_2/Q \in k[x,y]$ non nul
modulo $P$ (puisque $Q$ est non-trivial) mais de carré nul (puisque
c'est le produit de $P$ par $(P_1/Q)(P_2/Q) \in k[x,y]$), ce qui
contredit la radicalité supposée. Cet argument valant encore dans
$k(x)[y]$, on a $k(x)[y]/(P) \cong k(x)[y]/(P_1) \times k(x)[y]/(P_2)$
par le théorème chinois : autrement dit, $k(x)[y]/(P)$ n'est pas un
corps dans ces conditions (et $k[x,y]/(P)$ n'est pas un anneau
intègre : il a $P_1,P_2$ comme diviseurs de zéro).
Pour souligner que cette situation ne se produit pas, on pourra parler
de « courbes irréductibles » (avec la définition que nous avons prise,
c'est redondant). On rappelle
(cf. \ref{definition-irreducible-closed-set}) qu'un fermé de Zariski
$Z(I)$ est dit « irréductible » lorsqu'il n'est pas réunion de deux
fermés strictement plus petits.
\thingy\label{example-curve-irreducible-but-not-geometrically}
Mentionnons encore une situation à garder à l'esprit : si $P = y^2+1
\in k[x,y]$ sur un corps $k$ dans lequel $-1$ n'est pas un carré, par
exemple le corps des réels, alors $P$ est bien irréductible, mais il
cesse de l'être sur la clôture algébrique où $P =
(y+\sqrt{-1})(y-\sqrt{-1})$ : on dit que ce polynôme est irréductible
mais non \emph{géométriquement} irréductible,
cf. \ref{geometric-irreducibility}. (Dans les exemples vus
précédemment, $x^2+y^2+1$, $x^2+y^2-1$, $y^2-x^3-x^2$, $y^2-x^3+x^2$
et $y^2-x^3$, l'irréductibilité de $P$ n'était jamais perdue en
montant à un corps plus gros.)
Le corps $k(x,y: P=0) = k(x)[y]/(P)$ des fonctions de la courbe est
simplement $k(\sqrt{-1},x)$ (par exemple, $\mathbb{R}(x)[y]/(y^2+1)$
est $\mathbb{C}(x)$).
Il faut imaginer cette courbe de la façon suivante : c'est la réunion
de deux droites « géométriques » (c'est-à-dire définies sur la clôture
algébrique), $y = \sqrt{-1}$ et $y = -\sqrt{-1}$, ces droites étant
permutées par le groupe de Galois (qui échange $\sqrt{-1}$ et
$-\sqrt{-1}$). Autrement dit, on a affaire à un fermé de Zariski qui
est irréductible (cf. \ref{closed-irreducible-iff-prime-ideal}) mais
qui cesse de l'être sur la clôture algébrique
(cf. \ref{geometric-irreducibility}).
Lorsque $P$ est géométriquement (=absolument) irréductible, on dira
que la courbe plane $\{P=0\}$ \index{géométriquement
irréductible}\index{absolument irréductible}l'est. Une conséquence
de cette propriété sur le corps $K := k(x,y: P=0)$ est que, d'après la
proposition \ref{field-of-fractions-versus-change-of-scalars}, dans le
corps $K.k^{\alg} = k^{\alg}(x,y: P=0)$, les sous-corps $K$ et
$k^{\alg}$ sont linéairement disjoints sur $k$. Cette propriété sera
parfois utile.
\thingy\label{function-field-of-an-irreducible-set}
Bien sûr, il n'y a pas de raison de se limiter aux courbes
\emph{planes} ou même, dans une certaine mesure, de se limiter aux
courbes du tout : si $I \subseteq k[t_1,\ldots,t_d]$ est un idéal
premier quelconque, alors $X := Z(I)$ est un fermé de Zariski
irréductible, et le corps des fractions de l'anneau intègre
$k[t_1,\ldots,t_d]/I$ des fonctions régulières sur $X$ mérite de
s'appeler \defin[rationnelle (fonction)]{corps des fonctions rationnelles} de $X$, qu'on peut
noter $k(X)$. Le degré de transcendance $\degtrans_k k(X)$ sera
appelé \defin{dimension} de $X$, mais nous ne considérerons vraiment
que le cas des courbes, c'est-à-dire, de la dimension $1$ : celui-ci a
de particulier qu'on pourra alors voir un élément de $k(X)$ comme une
vraie fonction de $X$ vers $\mathbb{P}^1$, quitte à lui la
valeur $\infty$ sur les pôles (alors qu'en dimension $\geq 2$ une
fonction rationnelle peut ne pas être définie sans pour autant avoir
un pôle : penser à $x/y$ en $(x,y) = (0,0)$).
La même remarque que ci-dessus vaut : si le fermé de Zariski $X$ est
géométriquement (=absolument) irréductible
(cf. \ref{geometric-irreducibility}), son corps des fractions $K :=
\Frac(k[t_1,\ldots,t_d]/I)$ a la propriété, d'après la
proposition \ref{field-of-fractions-versus-change-of-scalars}, que
dans le corps $K.k^{\alg} =
\Frac(k^{\alg}[t_1,\ldots,t_d]/(I.k^{\alg}))$, les sous-corps $K$ et
$k^{\alg}$ sont linéairement disjoints sur $k$. En dimension $1$ on
dira que la courbe associée au corps $K$ est elle-même géométriquement
irréductible.
\thingy\label{remark-separating-transcendence-basis-geometrically}
Si $I \subseteq k[t_1,\ldots,t_d]$ est un idéal premier tel
que $Z(I)$ soit de dimension $1$, c'est-à-dire que le corps des
fractions $K$ de l'anneau intègre $k[t_1,\ldots,t_d]/I$ soit un corps
de fonctions de courbe au sens où on l'a défini, la
proposition \ref{separating-transcendence-basis-over-perfect-field}
montre que, au moins si $k$ est un corps \emph{parfait}, on peut
toujours se ramener à la situation qui vient d'être décrite. (Et si
$k$ n'est pas parfait, on peut défendre l'idée que la définition
donnée en \ref{definition-function-field} n'est pas la bonne et qu'on
devrait supposer $K$ algébrique \emph{séparable} sur une extension
transcendante pure $k(x)$.) En un certain sens, donc, toutes les
courbes algébriques sont « planes » (mais de nouveau, ceci dépend
hautement du point de vue choisi pour étudier les courbes).
On peut dire mieux : en étudiant la démonstration de la
proposition \ref{separating-transcendence-basis-over-perfect-field}
(et du théorème \ref{primitive-element-theorem} dont elle dépend), on
voit que celle-ci est constructive (elle peut être rendue
algorithmique) : on va obtenir explicitement deux coordonnées $x,y \in
K$ telles que $K = k(x,y)$ avec $x$ transcendant et $y$ algébrique
séparable sur $k(x)$, c'est-à-dire une façon de tracer la courbe dans
le plan ; en fait, c'est même une projection linéaire qui conviendra,
puisque dans la démonstration de \ref{primitive-element-theorem} on
n'a pris que des combinaisons linéaires des indéterminées, donc $x$ et
$y$ sont finalement des combinaisons linéaires des (classes des)
coordonnées $t_i$ de départ. Cette projection peut, cependant,
introduire des singularités (il existe des courbes algébriques qui ne
peuvent pas être représentées comme des courbes planes
non-singulières).
\subsection{Anneaux de valuations}\label{subsection-valuation-rings}
\begin{defn}\label{definition-valuation-ring}
Soit $K$ un corps. On appelle \index{valuation (anneau
de)}\defin{anneau de valuation} de $K$ un sous-anneau $R$ de $K$
vérifiant la propriété suivante :
\begin{center}
pour tout $x \in K$, on a soit $x \in R$ soit $x^{-1} \in R$.
\end{center}
Lorsque $k$ est un sous-corps de $K$ contenu dans $R$, on peut dire
que $R$ est un anneau de valuation \textbf{au-dessus} de $k$.
Lorsque de plus $R \neq K$, on dit qu'il s'agit d'un anneau de
valuation \emph{non-trivial}.
\end{defn}
\thingy\label{valuation-from-valuation-ring}
Dans les conditions ci-dessus, $R$ est un anneau intègre
(puisque c'est un sous-anneau d'un corps), et il est clair que $K$ est
le corps des fractions de $R$ (cf. \ref{definition-fraction-field} ;
tout élément de $K$ est quotient d'éléments de $R$ puisqu'il est même
toujours de la forme $x$ ou $\frac{1}{x}$ !). On peut donc parler
dans l'absolu d'un « anneau de valuation », c'est un anneau de
valuation de son corps des fractions.
On dira qu'un élément $x$ de $K$ a une \emph{valuation plus grande}
(pour $R$) qu'un élément $y$ lorsque $x = yz$ avec $z \in R$ ; on
dira, bien sûr, qu'ils ont la \emph{même valuation} lorsque $x = yz$
avec $z \in R^\times$ (lire : $z$ inversible dans $R$), ce qui
signifie bien sûr exactement que $x$ a une valuation plus grande
que $y$ et réciproquement. Il s'agit là d'une relation d'équivalence
sur $K$ : les classes d'équivalences des éléments non nuls s'appellent
les \emph{valuations} : on notera $v_R(x)$ ou simplement $v(x)$ pour
la valuation de $x$ ; la classe de $0 \in R$ sera mise à part et
notée $\infty$ (on écrira $v(0) = \infty$ mais on ne considère
généralement pas qu'il s'agisse d'une valuation). La définition d'un
anneau de valuation fait qu'on a défini une relation d'ordre
\emph{total} sur l'ensemble des valuations (plus $\infty$ qui est le
plus grand élément).
On définit $v(x)+v(y)$ comme $v(xy)$ et on note $0$ pour $v(1)$ (ou
$v(c)$ pour n'importe quel $c\in R^\times$) : cette définition a bien
un sens comme on le vérifie facilement, et fait de l'ensemble des
valuations (sans compter le symbole spécial $\infty$) un \emph{groupe}
abélien, appelé \textbf{groupe des valuations} (ou \textbf{des
valeurs}) de $R$ (ou de $K$ pour $R$), qui n'est autre que le groupe
quotient $\Gamma := K^\times/R^\times$. Avec l'ordre qu'on a mis
ci-dessus, il s'agit d'un \emph{groupe abélien totalement ordonné},
c'est-à-dire que si $u \geq u'$ alors $u+w \geq u'+w$ quel que
soit $w$.
Lorsque le groupe des valuations est $\mathbb{Z}$, c'est-à-dire qu'il
est engendré par un unique élément (on peut alors choisir un
générateur strictement positif, qui est forcément le plus petit
élément strictement positif, et qu'on peut noter $1$), on dira que $R$
est un anneau de valuation \defin[discrète (valuation)]{discrète}.
\begin{prop}\label{valuation-ring-versus-valuation-function}
Si $R$ est un anneau de valuation de $K$ et $v\colon K \to \Gamma \cup
\{\infty\}$ la valuation associée, on a les propriétés suivantes :
\begin{itemize}
\item[(o)]$v(x)=\infty$ si et seulement si $x=0$,
\item[(i)]$v(xy) = v(x)+v(y)$,
\item[(ii)]$v(x+y) \geq \min(v(x),v(y))$,
\end{itemize}
et de plus,
\begin{itemize}
\item[(ii.b)] $v(x+y) = \min(v(x),v(y))$ si $v(x)\neq v(y)$,
\end{itemize}
qui est une conséquence des précédentes.
L'anneau $R$ peut se retrouver à partir de la valuation comme $\{x\in
K : v(x) \geq 0\}$.
Réciproquement, si $\Gamma$ est un groupe abélien totalement ordonné
et $v\colon K \to \Gamma \cup \{\infty\}$ une fonction surjective
vérifiant (o), (i) et (ii), alors $R := \{x\in K : v(x) \geq 0\}$ est
un anneau de valuation qui a $v$ pour valuation associée : on dit
alors que $v$ est une \defin{valuation} sur $K$ ou sur $R$.
En particulier, on peut définir un anneau de valuation discrète comme
un anneau $R$ muni d'une fonction $v\colon \Frac(R) \to \mathbb{Z}
\cup \{\infty\}$ qui vérifie (o), (i) et (ii) et qui atteint la
valeur $1$.
\end{prop}
\begin{proof}
Si $v$ est la valuation associée à un anneau de valuation $R$, alors
l'affirmation (o) est la définition du symbole $\infty$, et
l'affirmation (i) est la définition de l'addition dans $\Gamma$ ; pour
montrer (ii), on peut supposer (puisque $\Gamma$ est totalement
ordonné) que $v(x) \geq v(y)$, c'est-à-dire $x = yz$ avec $z \in R$,
auquel cas on a $x+y = y(1+z)$ avec $1+z \in R$, ce qui montre bien
$v(x+y) \geq v(y)$.
Pour déduire $v(x+y) = \min(v(x),v(y))$ de (ii) dans le cas où $v(x)
\neq v(y)$, on peut supposer $v(x) > v(y)$, et donc $v(x+y) \geq
v(y)$ ; mais par ailleurs, $y = (x+y) - x$ (et bien sûr $v(-1) = 0$ vu
que $(-1)^2 = 1$) si bien que $v(y) \geq \min(v(x+y),v(x))$, or on a
$v(x) > v(y)$ donc en fait $v(x+y) = v(y)$, ce qu'on voulait.
Le fait que $R = \{x\in K : v(x) \geq 0\}$ est la définition de
l'ordre (et le fait que $0 = v(1)$).
Enfin, si $v$ vérifie (o), (i) et (ii) et $R := \{x\in K : v(x) \geq
0\}$, alors $R$ est un sous-anneau de $K$ car il contient $0$
d'après (o), est stable par addition d'après (ii) et par
multiplication d'après (i) ; et c'est un anneau de valuation car si
$x\not\in R$ c'est que $v(x) < 0$ donc $v(x^{-1}) = -v(x) > 0$ (en
utilisant (i)), donc $x^{-1} \in R$. Et la valuation associée à $R$
est bien $v$ car $x = yz$ pour $z \in R$ entraîne $v(x) \geq v(y)$
par (i), et notamment $v(x) = v(y)$ si et seulement si $x = yz$ pour
un certain $z \in R^\times$ : alors $v \colon K^\times \to \Gamma$
définit un isomorphisme de groupes ordonnés de $K^\times/R^\times$
sur $\Gamma$.
Pour ce qui est de l'affirmation du dernier paragraphe, constater que
$v\colon K^\times \to \mathbb{Z}$ est surjective si et seulement si
elle atteint la valeur $1$.
\end{proof}
\thingy Les valuations de $K$ et les anneaux de valuations de $K$ sont
donc exactement interchangeables, et on se permettra d'utiliser la
terminologie de l'un pour l'autre. Par exemple, dire qu'une valuation
est non-triviale signifie qu'elle ne prend pas que les valeurs $0$
et $\infty$. Dire qu'une valuation est au-dessus de $k$ (sous-corps
de $K$) signifie qu'elle est nulle sur $k^\times$ (ou positive
sur $k$, ce qui revient au même).
\thingy\label{remark-on-sums-in-valuation-rings} Une conséquence
fréquemment utilisée des propriétés des valuations est qu'une somme
$x_1 + \cdots + x_n$ dans laquelle un des termes a une valuation
\emph{strictement plus petite} que tous les autres n'est jamais nulle.
(En effet, si $v(x_i) < v(x_j)$ pour tout $j\neq i$, alors $v(x_i) <
v(y)$ où $y := \sum_{j\neq i} x_j$ d'après la propriété (ii), et
(ii.b) entraîne alors que la valuation de la somme est égale à celle
de $x_i$, donc n'est pas $\infty$.).
\thingy\label{valuations-on-integral-domains} Si $A$ est un anneau et
$v\colon A \to \Gamma\cup\{\infty\}$ (où $\Gamma$ est un groupe
abélien totalement ordonné) une fonction vérifiant (o), (i) et (ii)
de \ref{valuation-ring-versus-valuation-function}, alors $A$ est
intègre (à cause de (i)), et il est facile de vérifier que $v$ se
prolonge de façon unique en une valuation sur son corps des fractions
$K$ en posant $v(x/y) = v(x)-v(y)$ (ce qui est manifestement
nécessaire et bien défini). Cette observation peut simplifier la
recherche ou l'étude des valuations sur un corps défini comme corps
des fractions. Le plus souvent, dans la situation qu'on vient de
décrire, on considère $v$ positive sur $A$, et alors $A \subseteq R_v$
en notant $R_v$ l'anneau de valuation.
\thingy Les exemples les plus importants de valuations sont celles
introduites en \ref{function-field-of-the-line} ci-dessus (les $v_h$
ou $v_\xi$ introduits à cet endroit sont des exemples de valuations de
$k(t)$ au-dessus de $k$, et
en \ref{subsection-places-of-the-projective-line} on verra même que ce
sont presque les seules non-triviales ; ce sont par ailleurs des
valuations \emph{discrètes}).
Un autre exemple très semblable (important pour l'arithmétique,
quoique moins pour la géométrie) est donné par les valuations
$p$-adiques sur les rationnels : si $\frac{a}{b}$ est un rationnel et
$p$ un nombre premier, on peut définir $v_p(\frac{a}{b})$ comme
l'exposant de la plus grande puissance de $p$ qui divise $a$ moins
l'exposant de la plus grande puissance de $p$ qui divise $b$. On peut
montrer qu'il s'agit là de toutes les valuations non-triviales
sur $\mathbb{Q}$. (Les $v_h$ sur $k(t)$ évoquées ci-dessus sont
l'analogue exact de ces $v_p$ sur $\mathbb{Q}$ en utilisant la
décomposition des polynômes en facteurs irréductibles au lieu de la
décomposition des entiers en facteurs premiers.) Il s'agit là aussi
de valuations discrètes ; en revanche, elles ne sont pas au-dessus
d'un corps.
Pour donner au moins quelques exemples de valuations qui ne soient pas
discrètes, sur l'anneau $k[x,y]$ des polynômes en deux indéterminées
on peut définir $v(x^i y^j) = (i,j)$ à valeurs dans le groupe
$\mathbb{Z}^2$ muni de l'ordre lexicographique donnant le poids le
plus fort à la première coordonnée (il s'agit bien d'un groupe
totalement ordonné) : ceci s'étend de façon unique en une valuation
sur ($k[x,y]$, puis) $k(x,y)$, qui n'est pas une valuation discrète.
Si $\theta$ est un nombre réel strictement positif et irrationnel, on
peut aussi définir $v(x^i y^j) = i + j\theta$ à valeurs dans
$\mathbb{Z} \oplus \mathbb{Z}\theta \subseteq \mathbb{R}$ muni de son
ordre hérité des réels, ce qui, de nouveau, définit une valuation sur
($k[x,y]$, puis) $k(x,y)$, qui n'est pas une valuation discrète. Ce
type d'exemple ne nous intéressera guère, car on va voir
en \ref{valuations-on-curves-are-discrete} ci-dessous que toutes les
valuations non-triviales sur les courbes sont discrètes.
\begin{prop}\label{local-rings}
Les deux propriétés suivantes sur un anneau non nul $R$ sont
équivalentes :
\begin{itemize}
\item[(i)]$R$ a un unique idéal maximal,
\item[(ii)]le complémentaire dans $R$ de l'ensemble $R^\times$ des
unités de $R$ est un idéal (forcément maximal),
\item[(iii)]pour tout $x\in R$, soit $x$ est inversible, soit $1-cx$
est inversible pour tout $c\in R$.
\end{itemize}
Un anneau vérifiant ces propriétés est appelé un anneau \defin[local
(anneau)]{local}.
\end{prop}
\begin{proof}
Soit $R^\times$ l'ensemble des unités de $R$. Comme une unité
engendre l'idéal (unité !) $R$, tout idéal autre que $R$ est inclus
dans le complémentaire $R \setminus R^\times$.
Si (i) $R$ a un unique idéal maximal $\mathfrak{m}$, alors tout
élément $x \in R$ qui \emph{n'est pas} une unité engendre un idéal
$(x)$ qui est inclus dans $\mathfrak{m}$
d'après \ref{existence-maximal-ideals}, donc $x \in \mathfrak{m}$ :
ceci montre $(R\setminus R^\times) \subseteq \mathfrak{m}$, et
l'inclusion réciproque résulte du paragraphe précédent, donc
$(R\setminus R^\times) = \mathfrak{m}$ et en particulier on a (ii).
Réciproquement, si (ii) $R \setminus R^\times$ est un idéal, on a
expliqué qu'il contient tout autre idéal strict, et en particulier, il
est l'unique idéal maximal, ce qui montre (i).
Considérons l'ensemble $\mathop{\mathrm{rad}} R$ des $x \in R$ tels
que $1-cx$ soit inversible pour tout $c \in R$. Sans aucune hypothèse
sur $R$, on peut faire les observations suivantes : si $x \in
\mathop{\mathrm{rad}} R$ et $a \in R$ alors $ax \in
\mathop{\mathrm{rad}} R$ (car $1-cax$ est de la forme $1-c'x$
où $c'=ca$) ; dire que $1-cx$ est inversible pour tout $c \in R$
équivaut à dire que $u-cx$ est inversible pour tout $c \in R$ et tout
$u \in R^\times$ (cette dernière condition est \textit{a priori} plus
forte, mais comme $u-cx = u(1-c'x)$ où $c'=u^{-1}c$, le fait que $x
\in \mathop{\mathrm{rad}} R$ entraîne bien cette condition plus
forte) ; enfin, si $x,y\in \mathop{\mathrm{rad}} R$ alors $1-c(x+y) =
(1-cx)-cy$ est de la forme $u-cy$ où $u\in R^\times$ donc est
inversible : tout ceci montre que $\mathop{\mathrm{rad}} R$ est un
\emph{idéal}\footnote{On l'appelle \textbf{idéal de Jacobson} de $R$,
et on peut montrer que c'est toujours l'intersection des idéaux
\emph{maximaux} de $R$ : comparer avec \ref{nilradical-facts}.}
de $R$. Manifestement, les conditions $x \in R^\times$ et $x \in
\mathop{\mathrm{rad}} R$ sont toujours incompatibles (prendre pour $c$
l'inverse de $x$) dans un anneau non-nul.
On vient de voir que $\mathop{\mathrm{rad}} R$ est un idéal strict,
i.e., contenu dans $R\setminus R^\times$ : si (iii) leur union
est $R$, alors ils sont complémentaires, donc le complémentaire de
$R\setminus R^\times$ est un idéal, ce qui montre (ii).
Enfin, si (ii) $R\setminus R^\times$ est un idéal $\mathfrak{m}$, et
si $x \not\in R^\times$, c'est-à-dire $x\in \mathfrak{m}$, alors $cx
\in\mathfrak{m}$ quel que soit $c\in R$, donc $1-cx$ est
dans $R^\times$, et on a bien montré (iii).
\end{proof}
\thingy Un exemple d'anneau local est celui formé des fractions
rationnelles $f/g \in k(t_1,\ldots,t_n)$ dont un dénominateur $g$ (ou,
si on préfère, le dénominateur réduit) ne s'annule pas à l'origine (on
vérifie facilement qu'il s'agit d'un anneau) : son idéal maximal est
alors formé de celles dont le \emph{numérateur} s'annule à l'origine.
Plus généralement, si $\mathfrak{p}$ est un idéal premier de
$k[t_1,\ldots,t_n]$, l'anneau des fractions rationnelles de la forme
$f/g$ avec $f,g \in k[t_1,\ldots,t_n]$ et $g\not\in\mathfrak{p}$
(i.e., le dénominateur réduit n'est pas identiquement nul
sur $V(\mathfrak{p})$) est un anneau local dont l'idéal maximal est
formé des fractions avec $f\in\mathfrak{p}$ et $g\not\in\mathfrak{p}$.
\begin{prop}\label{valuation-rings-are-local-rings}
Un anneau de valuation est un anneau local.
\end{prop}
\begin{proof}
Pour $x\in R$, on sait que $x \not\in R^\times$ équivaut à $v(x) > 0$.
Il s'ensuit que l'ensemble de ces $x$ est un idéal (c'est un groupe
additif d'après la propriété (ii)
de \ref{valuation-ring-versus-valuation-function}, et il est absorbant
pour la multiplication d'après la propriété (i)). On conclut
par \ref{local-rings}.
\end{proof}
\thingy Le corps quotient d'un anneau local $R$ par son idéal maximal
$\mathfrak{m}$ s'appelle le \index{résiduel (corps)}\defin{corps
résiduel} de $R$ ; en particulier, ceci s'applique à un anneau de
valuation avec $\mathfrak{m} := \{x\in R : v(x)>0\}$ comme on vient de
l'expliquer. Lorsque $v$ est une valuation sur un corps $K$, on peut
bien sûr parler de son corps résiduel, défini comme le quotient de
l'anneau de valuation $R := \{x\in K : v(x) \geq 0\}$ par l'unique
idéal maximal de ce dernier.
On note parfois $\mathcal{O}_v$ pour l'anneau de valuation d'une
valuation $v$ et $\mathfrak{m}_v$ pour son idéal maximal, et enfin
$\varkappa_v$ pour son corps résiduel $\mathcal{O}_v/\mathfrak{m}_v$.
On remarquera que si la valuation $v$ est au-dessus de $k$, alors
$\varkappa_v$ est une extension de $k$.
Une valuation non-triviale au-dessus de $k$ sur un corps $K$ de
fonctions sur $k$ comme en \ref{definition-function-field} s'appelle
une \defin{place} (ou, s'il faut être plus explicite, une $k$-place)
de $K$. (Cette terminologie est essentiellement utilisée pour le
corps des fonctions d'une courbe $K = k(C)$, i.e., en degré de
transcendance $1$, auquel cas on peut indifféremment parler de places
de $C$.) On notera parfois $\mathscr{V}_K$ (ou, s'il faut être plus
explicite, $\mathscr{V}_{K/k}$) l'ensemble des $k$-places de $K$.
\begin{prop}\label{existence-of-valuations}
Soit $K$ un corps, soit $A \subseteq K$ un sous-anneau et soit
$\mathfrak{p}$ un idéal premier
(cf. \ref{regular-elements-and-prime-ideals}) de $A$. Alors il existe
un anneau de valuation $R$ de $K$ tel que $A \subseteq R \subseteq K$
et que $\mathfrak{m} \cap A = \mathfrak{p}$ en notant $\mathfrak{m}$
l'idéal maximal de $R$ (cf. \ref{valuation-rings-are-local-rings}).
\end{prop}
\begin{proof}
Soit $A'$ l'ensemble des quotients $\frac{a}{q}$ avec $a\in A$ et $q
\not\in \mathfrak{p}$ : on rappelle que le produit de deux éléments
qui ne sont pas dans $\mathfrak{p}$ n'est pas dans $\mathfrak{p}$, ce
qui permet de voir que $A'$ est stable par addition et multiplication
(en utilisant les formules usuelles $\frac{a}{q} + \frac{a'}{q'} =
\frac{aq'+a'q}{qq'}$ et $\frac{a}{q} \cdot \frac{a'}{q'} =
\frac{aa'}{qq'}$) ; il contient bien sûr $0$ et $1$ et est donc un
sous-anneau de $K$ vérifiant $A \subseteq A' \subseteq K$. L'idéal
$\mathfrak{p}'$ de $A'$ formé des $\frac{p}{q}$ avec $p\in
\mathfrak{p}$ et $q\not\in \mathfrak{p}$ est maximal et est même
l'unique idéal maximal de $A'$ (tout élément qui n'est pas
dans $\mathfrak{p}'$ est inversible dans $A'$ par construction ; on
pourrait remarquer au passage que le corps $A'/\mathfrak{p}'$ est le
corps des fractions de $A/\mathfrak{p}$) ; notons par ailleurs que
$\mathfrak{p}' \cap A = \mathfrak{p}$ (car si $\frac{p}{q} =: a \in A$
avec les notations d'avant, $p = aq \in \mathfrak{p}$ implique $a \in
\mathfrak{p}$ vu que $q \not\in \mathfrak{p}$).
On remplace maintenant $A$ par $A'$ et $\mathfrak{p}$
par $\mathfrak{p}'$ : comme on vient de le voir, ceci permet de
supposer que $A$ est un anneau \emph{local}, dont l'unique idéal
maximal est noté $\mathfrak{p}$.
Soit $\mathscr{F}$ l'ensemble des sous-anneaux $R$ de $K$ contenant
$A$ et tels que $1 \not\in \mathfrak{p}R$ (où $\mathfrak{p}R$ est
l'idéal de $R$ engendré par $\mathfrak{p}$). Alors $\mathscr{F}$ est
non vide (il contient $A$) et si $\mathscr{T}$ est une partie
de $\mathscr{F}$ totalement ordonnée par l'inclusion (=: chaîne) alors
$R := \bigcup_{S\in\mathscr{T}} S$ est encore dans $\mathscr{F}$ (la
réunion d'une chaîne de sous-anneaux est un sous-anneau pour la même
raison que dans la preuve de \ref{existence-maximal-ideals}, ce
sous-anneau contient évidemment $A$, et si on pouvait écrire $1$ comme
combinaison linéaire à coefficients dans $R$ d'éléments
de $\mathfrak{p}$, ces coefficients seraient déjà dans un $S$
de $\mathscr{T}$, une contradiction). Ainsi, le
principe \ref{hausdorff-maximal-principle} s'applique et il existe $R$
maximal pour l'inclusion. On va montrer que $R$ répond au problème
posé.
Tout d'abord, vérifions que $R$ est un anneau local : comme
$\mathfrak{p}R \neq R$ par hypothèse, il est inclus
(cf. \ref{existence-maximal-ideals}) dans un idéal
maximal $\mathfrak{m}$. Si on répète la construction du premier
paragraphe de cette preuve, on peut considérer l'anneau $R'$ des
quotients $\frac{a}{q}$ avec $a\in R$ et $q\not\in\mathfrak{m}$ : la
maximalité de $R$ impose qu'en fait $R' = R$ c'est-à-dire que tout
élément n'appartenant pas à $\mathfrak{m}$ est inversible dans $R$.
L'idéal maximal $\mathfrak{m}$ est donc unique, i.e., $R$ est un
anneau local, comme annoncé.
De plus, on a $\mathfrak{m} \cap A = \mathfrak{p}$ puisque l'inclusion
$\supseteq$ est claire et que $\mathfrak{p}$ est un idéal maximal
de $A$. Il reste simplement à vérifier que $R$ est un anneau de
valuation.
Si $x \in K$ n'appartient pas à $R$, alors $R[x]$ est un sous-anneau
de $K$ contenant $R$ (donc $A$) et strictement plus grand que $R$ :
par maximalité de ce dernier, c'est que $1 \in \mathfrak{p}R[x]$,
c'est-à-dire qu'on peut écrire $1 = a_0 + a_1 x + \cdots + a_n x^n$
avec $a_i \in \mathfrak{p}R$, et en particulier $a_i \in
\mathfrak{m}$. Mais $1 - a_0 \not\in \mathfrak{m}$ est inversible
dans $R$ puisque $R$ est local, donc on peut multiplier l'égalité
précédente par son inverse, et quitte à appeler $b_i = a_i/(1-a_0)$,
on a $1 = b_1 x + \cdots + b_n x^n$ avec $b_i \in \mathfrak{m}$.
Choisissons une telle relation avec $n$ le plus petit possible. De
même, si $x^{-1}$ n'appartient pas à $R$, on choisit une relation $1 =
c_1 x^{-1} + \cdots + c_m x^{-m}$ avec $c_i \in \mathfrak{m}$ et $m$
le plus petit possible. Sans perte de généralité, on peut
supposer $n\geq m$ : alors quitte à multiplier la dernière relation
par $b_n x^n$ et la soustraire à la précédente, on obtient une
relation $1 = b'_1 x + \cdots + b'_{n-1} x^{n-1}$, toujours avec $b'_i
\in \mathfrak{m}$, ce qui contredit la minimalité de $n$. On a donc
bien montré que $x \in K$ implique soit $x\in R$ soit $x^{-1} \in R$.
\end{proof}
\thingy En particulier, si $I \subseteq J$ sont deux idéaux premiers
de $k[t_1,\ldots,t_d]$, si bien que $Z(I) \supseteq Z(J)$ sont deux
fermés de Zariski irréductibles
(cf. \ref{closed-irreducible-iff-prime-ideal}), alors le corps des
fonctions rationnelles $K = \Frac(k[t_1,\ldots,t_d]/I)$ de $Z(I)$
(cf. \ref{function-field-of-an-irreducible-set}) a au moins une
valuation $v$ qui soit positive sur $A := k[t_1,\ldots,t_d]/I$ et
strictement positive sur son idéal premier $J/I$ (et exactement sur
ces éléments de $A$). Cette situation nous importera notamment dans
le cas où $Z(I)$ est une courbe (par exemple $I = (P)$ avec $P \in
k[x,y]$ irréductible comme on a vu
en \ref{function-field-of-a-plane-curve}) et $Z(J)$ un point de la
courbe (plus exactement, un point fermé,
cf. \ref{rational-and-closed-points-of-zariski-closed-sets}(3)).
\begin{prop}\label{valuation-rings-and-integral-closure}
Soit $K$ un corps et soit $A \subseteq K$ un sous-anneau. Alors
l'intersection $B$ de tous les anneaux de valuations de $K$
contenant $A$ coïncide exactement avec l'ensemble des éléments $x \in
K$ qui sont \defin[entier (élément)]{entiers [algébriques]} sur $A$ au
sens où il existe un $f \in A[t]$ \emph{unitaire} non constant tel que
$f(x) = 0$.
(Cet ensemble $B$, qui est donc un sous-anneau de $K$, s'appelle la
\defin{fermeture intégrale} de $A$ dans $K$, ou \defin{clôture
intégrale} lorsque $K$ est le corps des fractions de $A$.)
En particulier, si $k$ est un sous-corps de $K$, alors l'intersection
de tous les anneaux de valuations de $K$ au-dessus de $k$ est la
fermeture algébrique (cf. \ref{relative-algebraic-closure}) de $k$
dans $K$.
\end{prop}
\begin{proof}
Montrons d'abord que si $x \in K$ est entier sur $A$ alors $x$
appartient à n'importe quel anneau de valuation $R$ de $K$
contenant $A$. Or si $x^n + a_1 x^{n-1} + \cdots + a_n = 0$ avec $a_i
\in A$ (et notamment $a_i \in R$), on ne peut pas avoir $v_R(x) < 0$
car on a $v(x^i) = i\,v(x)$, et si $a \in R$, comme $v(a) \geq 0$, on
a $v(a x^i) \geq i\,v(x)$ ; par conséquent, si on a une relation $x^n
+ a_1 x^{n-1} + \cdots + a_n = 0$, la valuation du terme $x^n$ est
$n\,v(x)$ donc strictement plus petite que celle de n'importe quel
autre terme de la somme, ce qui interdit qu'elle puisse être nulle
(cf. \ref{remark-on-sums-in-valuation-rings}). Ceci montre une
inclusion.
Montrons réciproquement que si $x$ n'est pas entier sur $A$ alors il
existe un anneau de valuation de $K$ contenant $A$ auquel $x$
n'appartient pas. Pour cela, posons $y = x^{-1} \in K$, et
considérons l'anneau $A[y]$ qu'il engendre avec $A$ et l'idéal $y
A[y]$ qu'il engendre dans cet anneau. On a $1 \not\in y A[y]$ sans
quoi il y aurait une relation du type $1 = a_1 y + \cdots + a_n y^n$,
donc $x^n = a_1 x^{n-1} + \cdots + a_n$ et $x$ serait entier sur $A$,
or on a supposé le contraire. L'idéal $y A[y]$ est donc strict et il
existe donc (cf. \ref{existence-maximal-ideals}) un idéal maximal
$\mathfrak{p}$ de $A[y]$ le contenant (donc contenant $y$).
D'après \ref{existence-of-valuations}, il existe $R$ anneau de
valuation de $K$ contenant $A[y]$ et dont l'idéal maximal
contienne $\mathfrak{p}$. En particulier, $v_R(y) > 0$, donc $v_R(x)
< 0$, ce qui signifie $x \not\in R$, ce qu'on voulait montrer.
\end{proof}
Les anneaux de valuation \emph{discrète} (ceux dont le groupe des
valeurs est $\mathbb{Z}$) ont des propriétés supplémentaires que n'ont
pas les anneaux de valuation en général :
\begin{prop}\label{discrete-valuation-rings-are-principal}
Soit $\mathcal{O}$ un anneau de valuation \emph{discrète}, dont on
note $\mathfrak{m}$ l'idéal maximal
(cf. \ref{valuation-rings-are-local-rings}) et $v$ la valuation.
Alors :
\begin{itemize}
\item[(a)]un élément $t \in \mathcal{O}$ engendre $\mathfrak{m}$ en
tant qu'idéal si et seulement si $v(t) = 1$ (où $1$ désigne le plus
petit élément strictement positif du groupe des valeurs, qui
identifie ce dernier à $\mathbb{Z}$), et en fixant $t$ un élément
comme on vient de dire (et il en existe),
\item[(b)]tout élément $x \neq 0$ de $K$ a une représentation unique
sous la forme $x = u t^r$ avec $u \in \mathcal{O}^\times$ et $r \in
\mathbb{Z}$, auquel cas on a $r = v(x)$,
\item[(c)]de même, tout idéal $I \neq (0)$ de $\mathcal{O}$ est
l'idéal $\{x\in\mathcal{O} : v(x)\geq r\}$ engendré par $t^r$ (en
particulier, $\mathcal{O}$ est principal) pour un certain $r \in
\mathbb{N}$.
\end{itemize}
Un élément $t$ tel que $v(t) = 1$ s'appelle une \defin{uniformisante}
de l'anneau de valuation discrète $\mathcal{O}$.
\end{prop}
\begin{proof}
Montrons le (a). Si $t$ engendre $\mathfrak{m}$, alors clairement
$v(t) = 1$ car pour tout $x$ tel que $v(x) > 0$, on peut écrire $x = t
z$ pour un certain $z \in \mathcal{O}$ (puisque $x \in \mathfrak{m}$
et que $t$ engerndre cet idéal), donc $v(x) \leq v(t)$ et $t$ est bien
de la valuation strictement positive la plus petite possible.
Réciproquement, si $v(t) = 1$ (la valuation strictement positive la
plus petite possible), et si $x \in \mathfrak{m}$, alors $v(x) \geq
v(t)$ par la minimalité supposée de $v(t)$, c'est-à-dire $x/t \in
\mathcal{O}$, ce qui prouve bien $x \in t\mathcal{O}$.
L'existence de $t$ est simplement une conséquence de la définition de
la valuation (ou de l'élément $1$ dans le groupe des valeurs).
Montrons maintenant le (b). Si $v(x) = r$ alors $u := x/t^r$ est de
valuation nulle, c'est-à-dire dans $\mathcal{O}^\times$.
Réciproquement, si $x = u t^r$, on a $v(x) = v(u) + r v(t) = r$
puisque $v(u)=0$ et $v(t)=1$.
Remarquons que les multiples de $u t^r$ dans $\mathcal{O}$ sont les
éléments de la forme $uu' t^{r+r'}$ c'est-à-dire les éléments de
valuation $\geq r$.
Montrons enfin le (c). Si $x \in I$ a la plus petite valuation
possible pour un élément de $I$, disons $x = u t^r$ comme on vient de
voir, et alors $t^r \in I$ donc $I$ contient l'idéal engendré par
$t^r$, qui d'après le paragraphe précédent est $\{x\in\mathcal{O} :
v(x)\geq r\}$ ; mais réciproquement, tout élément de $I$ a une
valuation supérieure ou égale à $v(x) = r$ par minimalité supposée
de $x$, donc il y a bien égalité entre $I$ et l'idéal
$\{x\in\mathcal{O} : v(x)\geq r\}$ engendré par $t^r$.
\end{proof}
\subsection{Places des courbes}\label{subsection-places-of-curves}
\begin{lem}\label{key-lemma-on-valuations-of-a-curve}
Soit $K$ un corps de fonctions de courbe sur $k$
(cf. \ref{definition-function-field}) et $v$ une valuation
de $K$ au-dessus de $k$ (cf. \ref{valuation-ring-versus-valuation-function}).
(A) Si $x$ vérifie $0 \neq v(x) < \infty$, alors $x$ est transcendant
sur $k$ et le corps $K$ est \emph{fini} sur $k(x)$.
(B) Si $x_1,\ldots,x_n$ vérifient $0 < v(x_1) < v(x_2) < \cdots <
v(x_n) < \infty$, alors $x_1,\ldots,x_n$ sont linéairement
indépendants sur $k(x_n)$, et en particulier le degré $[K : k(x_n)]$
(lequel est fini d'après (A)) est supérieur ou égal à $n$.
(C) Si $x$ vérifie $0 < v(x) < \infty$, alors $[\varkappa_v : k] \leq
[K : k(x)]$ (en particulier, il est fini d'après (A)), où $\varkappa_v
:= \mathcal{O}_v/\mathfrak{m}_v$ est le corps résiduel de la
place $v$.
\end{lem}
(Voir aussi le théorème \ref{degree-identity} plus bas pour une
généralisation de (B) et (C).)
\begin{proof}
Pour ce qui est de (A), on peut le déduire
de \ref{valuation-rings-and-integral-closure}, mais on va le faire
directement. Commençons par supposer $v(x) < 0$ et
cherchons à montrer la transcendance de $x$ : on a $v(x^i) = i\,v(x)$,
et si $a \in k^\times$, comme $v(a) = 0$ (puisque la valuation est
au-dessus de $k$), on a $v(a x^i) = i\,v(x)$ ; par conséquent, si on a
une relation $x^n + a_1 x^{n-1} + \cdots + a_n = 0$, la valuation du
terme $x^n$ est $n\,v(x)$ donc strictement plus petite que celle de
n'importe quel autre terme de la somme, ce qui interdit qu'elle puisse
être nulle (cf. \ref{remark-on-sums-in-valuation-rings}). Le cas
$v(x) > 0$ s'en déduit en passant à $x^{-1}$ (l'inverse d'un
algébrique étant encore algébrique,
cf. \ref{relative-algebraic-closure}). Enfin, une fois connu le fait
que $x$ est transcendant, donc une \emph{base} de transcendance de $K$
sur $k$ (cf. \ref{transcendence-basis-facts} (1a) et (3)), l'extension
$k(x) \subseteq K$ est algébrique, et comme elle est aussi de type
fini, elle est \emph{finie}
(cf. \ref{basic-facts-algebraic-extensions}(2)). Ceci démontre (A).
Passons à l'affirmation (B) : supposons qu'on ait $f_1 x_1 + \cdots +
f_n x_n = 0$ avec $f_i \in k(x_n)$ non tous nuls. Posons $x := x_n$.
On a vu ci-dessus que $x$ était transcendant sur $k$, c'est-à-dire que
les $f_i$ sont des fractions rationnelles en $x$. Quitte à chasser
les dénominateurs, on peut supposer $f_i \in k[x]$ et que $x$ ne les
divise pas tous. Soit $c_i = f_i(0)$ le terme constant de $f_i$ (non
tous nuls, donc), mettons $f_i = c_i + x g_i$ où $g_i \in k[x]$, et
soit $j$ le plus petit possible tel que $c_j \neq 0$ : ainsi, on a
$c_j x_j + \cdots + c_n x_n + g_1 x x_1 + \cdots + g_n x x_n = 0$. Or
la valuation $v(c_j x_j) = v(x_j)$ est strictement plus petite que
celle de n'importe quel autre terme dans cette somme (puisque $v(g_i)
\geq 0$ et $v(x x_i) = v(x_n) + v(x_i) > v(x_n) \geq v(x_j)$), ce qui
interdit que la somme puisse être nulle
(cf. \ref{remark-on-sums-in-valuation-rings}). Ceci démontre (B).
Pour ce qui est de (C) : considérons des éléments $b_1,\ldots,b_n$ de
$\varkappa_v$ qui sont linéairement indépendants sur $k$, et soient
$y_i \in \mathcal{O}_v$ qui représente la classe $b_i \in \varkappa_v
= \mathcal{O}_v/\mathfrak{m}_v$ : on aura montré (C) si on montre que
$y_1,\ldots,y_n$ sont linéairement indépendants sur $k(x)$. Supposons
qu'on ait $f_1 y_1 + \cdots + f_n y_n = 0$ avec $f_i \in k(x)$ non
tous nuls. On a vu en (A) que $x$ était transcendant sur $k$,
c'est-à-dire que les $f_i$ sont des fractions rationnelles en $x$.
Quitte à chasser les dénominateurs, on peut supposer $f_i \in k[x]$ et
que $x$ ne les divise pas tous. Soit $c_i = f_i(0) \in k$ le terme
constant de $f_i$ (non tous nuls, donc), mettons $f_i = c_i + x g_i$
où $g_i \in k[x]$. On a $c_1 y_1 + \cdots + c_n y_n + g_1 x y_1 +
\cdots + g_n x y_n =0$. Tous les termes de cette somme sont dans
$\mathcal{O}_v$ : en réduisant modulo $\mathfrak{m}_v$, les $g_i x
y_i$ disparaissent car $x \in \mathfrak{m}_v$ par hypothèse, et les
$y_i$ se réduisent en $b_i$. On a donc $c_1 b_1 + \cdots + c_n b_n =
0$, une contradiction. Ceci démontre (C).
\end{proof}
\begin{prop}\label{valuations-on-curves-are-discrete}
Soit $K$ un corps de fonctions de courbe sur $k$
(cf. \ref{definition-function-field}). Alors toutes les valuations
(cf. \ref{valuation-ring-versus-valuation-function}) non-triviales de
$K$ au-dessus de $k$ (=places de $K$) sont \index{discrète
(valuation)}\emph{discrètes} — c'est-à-dire qu'il existe un plus
petit élément strictement positif dans le groupe des valeurs et que
tous les éléments en sont des multiples entiers, si bien que le groupe
des valeurs peut s'identifier à $\mathbb{Z}$ pour son ordre usuel.
Notamment, tous les anneaux de valuation non-triviaux de $K$ au-dessus
de $k$ vérifient les propriétés annoncées
en \ref{discrete-valuation-rings-are-principal} (par exemple, ce sont
des anneaux \emph{principaux}).
\end{prop}
\begin{proof}
Soit $v \colon K \to \Gamma\cup\{\infty\}$ une valuation non-triviale
de $K$ au-dessus de $k$. Le fait que $v$ est non-triviale assure
qu'il existe $x\in K$ tel que $0\neq v(x) < \infty$, et alors le (A)
du lemme \ref{key-lemma-on-valuations-of-a-curve} montre que $K$ est
fini sur $k(x)$. Quitte à remplacer $x$ par $\frac{1}{x}$, on peut
supposer $v(x)>0$. Montrons qu'il existe un élément $z \in K$ avec
$v(z)$ strictement positif minimal : si ce n'est pas le cas de $x$, il
existe $x'$ tel que $0 < v(x') < v(x) < \infty$, et si $x'$ n'est
toujours pas minimal, il existe $x''$ tel que $0 < v(x'') < v(x') <
v(x) < \infty$, et ainsi de suite : ce processus doit terminer en au
plus $[K : k(x)]$ étapes d'après le (B) du lemme, donc il existe un $z
\in K$ avec $v(z)$ strictement positif minimal. Notons $1 := v(z)$.
Il reste à montrer que tout élément $u$ de $\Gamma$ est un multiple
entier de $1$. C'est trivial si $u=0$ donc quitte à remplacer
éventuellement $u$ par $-u$ on peut supposer $u > 0$. Toujours
d'après le (B) du lemme, il n'est pas possible qu'on ait $u > r\cdot
1$ (en notant $r\cdot 1$ pour $1+1+\cdots+1$ avec $r$ termes) pour
tout $r \in \mathbb{N}$. Il existe donc $r$ minimal tel que $r\cdot 1
\leq u$, et comme $u - (r\cdot 1) \geq 0$, par minimalité de $1$
dans $\Gamma$, il est soit nul soit $\geq 1$, mais le dernier cas
implique $(r+1)\cdot 1 \leq u$ ce qui contredit la minimalité de $r$ :
on a donc $u = r\cdot 1$, ce qu'on voulait montrer.
\end{proof}
\thingy\label{degree-of-a-place} La propriété (C) du
lemme \ref{key-lemma-on-valuations-of-a-curve} montre que, pour toute
place $v$ d'un corps de fonctions $K$ de courbe sur $k$, le corps
résiduel $\varkappa_v$ est une extension finie, donc algébrique,
de $k$. Le degré $[\varkappa_v : k]$ s'appelle aussi \defin[degré
(d'une place)]{degré} de la place $v$. S'il vaut $1$, c'est-à-dire
si $\varkappa_v = k$, la place $v$ est dite \defin[rationnelle
(place)]{rationnelle}. C'est notamment le cas si $k$ est
\emph{algébriquement clos}.
\thingy\label{evaluation-of-a-function-at-a-place}
Toujours pour $K$ un corps de fonctions de courbe sur $k$, si
$f\in K$ et si $v \in \mathscr{V}_K$ (i.e., $v$ est une place de $K$),
on peut définir $f(v) \in \varkappa_v$ (l'\defin{évaluation} de $f$ en
la place $v$) comme valant :
\begin{itemize}
\item la classe de $f \in \mathcal{O}_v$ modulo $\mathfrak{m}_v$,
lorsque $v(f) \geq 0$,
\item le symbole spécial\footnote{Le symbole $\infty$ introduit ici
(pour désigner un pôle d'une fonction) est différent de celui
introduit en \ref{valuation-from-valuation-ring} pour la valuation
de $0$ : on pourrait noter ce dernier $+\infty$ ou $\infty_\Gamma$
pour éviter la confusion, mais en pratique il y a peu de chances de
se tromper.} $\infty$ lorsque $v(f) < 0$ (on peut dire que $f$ a un
\defin[pôle (d'une fonction)]{pôle} en $v$).
\end{itemize}
Ceci permet de voir un élément de $K$ comme une fonction sur
$\mathscr{V}_K$ (mais comme elle prend des valeurs dans des ensembles
$\varkappa_v$ différents, ce n'est pas très agréable, sauf si $k$ est
algébriquement clos auquel cas on a bien affaire à une fonction
$\mathscr{V}_K \to k\cup\{\infty\}$).
On dira symétriquement que $f$ a un \defin[zéro (d'une
fonction)]{zéro} en la place $v$ lorsque $v(f) > 0$, c'est-à-dire
que $f(v) = 0$ (le $0$ de $\varkappa_v$ étant défini comme l'idéal
$\mathfrak{m}_v := \{x\in \mathcal{O}_v : v(x)>0\}$).
Pour récapituler, on pour $f \in K$ et $v \in \mathscr{V}_K$, on a
trois possibilités exclusives :
\begin{itemize}
\item $v(f) > 0$, ce qui équivaut à $f(v) = 0$, ce qui équivaut à $f
\in \mathfrak{m}_v$ : on dit que $f$ a un zéro en $v$ ;
\item $v(f) < 0$, ce qui équivaut à $f(v) = \infty$, ce qui équivaut à
$f \not\in \mathcal{O}_v$ : on dit que $f$ a un pôle en $v$ ;
\item $v(f) = 0$, ce qui équivaut à $f(v) \in \varkappa_v^\times$, ce
qui équivaut à $f \in \mathcal{O}_v^\times$.
\end{itemize}
La valuation $v(f)$ peut également être appelée \defin{multiplicité}
du zéro de $f$ en $v$ (même si cette terminologie est un peu abusive
ou bizarre si en fait $v(f)<0$), et inversement, au moins si $v(f)<0$,
l'entier $-v(f)$ peut être appelé multiplicité du pôle de $f$ en $v$.
On rappelle qu'on a donné le nom d'\defin{uniformisante} en $v$ à un
$f \in K$ tel que $v(f) = 1$ (c'est-à-dire, avec la terminologie qu'on
vient d'introduire, une fonction qui a un zéro d'ordre exactement $1$
en $v$). On parle aussi de \defin{paramètre local} pour $K$ en $v$.
\thingy\label{constant-functions-on-a-curve} D'après la
proposition \ref{valuation-rings-and-integral-closure}, la fermeture
algébrique $\tilde k$ de $k$ dans $K$ coïncide avec l'ensemble des
fonctions $f\in K$ telles que $v(f) \geq 0$ pour toute place $v \in
\mathscr{V}_K$, autrement dit, les fonctions qui n'ont pas de pôle.
En passant à l'inverse, il s'agit également de l'ensemble des
fonctions qui n'ont pas de zéro (plus la fonction identiquement
nulle). Ces fonctions seront dites \defin[constante
(fonction)]{constantes}. Pour dire les choses autrement, les
conditions conditions suivantes sur $f \in K$ sont équivalentes :
\begin{itemize}
\item $f$ est transcendant sur $k$,
\item il existe au moins une place $v$ de $K$ où $f$ ait un pôle,
\item $f$ n'est pas nul, et il existe au moins une place $v$ de $K$ où
$f$ ait un zéro,
\item $f$ n'est pas constante,
\end{itemize}
(la dernière étant la définition du mot « constant » dans ce
contexte). Le corps $\tilde k$ peut s'appeler \textbf{corps des
constantes} de $K$ (sur $k$).
(Notons au passage que puisque $\tilde k \neq K$, c'est-à-dire que $K$
est de degré de transcendance $1$ sur $k$, il existe toujours des
places — chose qui n'était pas triviale \textit{a priori} !)
\thingy\label{fields-of-constants-and-geometrically-integral-curves}
En général, $\tilde k$ peut être strictement plus grand que $k$ : un
exemple de ce phénomène a été donné
en \ref{example-curve-irreducible-but-not-geometrically} (où $\tilde k
= k(\sqrt{-1})$, par exemple $k=\mathbb{R}$ et $\tilde k=\mathbb{C}$).
On sera souvent amené à faire l'hypothèse que $\tilde k = k$,
c'est-à-dire que $k$ est \emph{algébriquement fermé}
(cf. \ref{relative-algebraic-closure}) dans $K$ ; ceci se produit
notamment lorsque $K = k(C)$ est défini (au sens
de \ref{function-field-of-a-plane-curve} ou plus généralement
de \ref{function-field-of-an-irreducible-set}) par un polynôme $P \in
k[x,y]$ ou un fermé de Zariski $Z(I)$ \emph{géométriquement}
irréductible (cf. \ref{geometric-irreducibility}) : en effet, on a
signalé en \ref{function-field-of-an-irreducible-set} que si c'est le
cas, disons avec $K = \Frac(k[t_1,\ldots,t_d]/I)$, d'après la
proposition \ref{field-of-fractions-versus-change-of-scalars}, dans le
corps $K.k^{\alg} = \Frac(k^{\alg}[t_1,\ldots,t_d]/(I.k^{\alg}))$, les
sous-corps $K$ et $k^{\alg}$ sont linéairement disjoints sur $k$ et en
particulier, leur intersection $\tilde k$ est égale à $k$.
(On peut bien sûr aussi se ramener à $\tilde k = k$ en redéfinissant
simplement $k$ comme égal à $\tilde k$, à condition qu'on ne tienne
pas à garder le corps de base fixé.)
\thingy La remarque suivante peut être utile : tous les corps
résiduels $\varkappa_v$ sont des extensions de $\tilde k$ (puisque
$\tilde k$ est l'intersection de tous les $\mathcal{O}_v$, on a des
morphismes d'anneaux $\tilde k \to \varkappa_v$). Notamment, $[\tilde
k : k]$ divise tous les $\deg(v) = [\varkappa_v : k]$
(cf. \ref{degree-of-a-place}), et en particulier, s'il existe une
place \emph{rationnelle} (c'est-à-dire $\deg(v) = 1$), ou simplement
deux places de degrés premiers entre eux, on a $\tilde k = k$.
\subsection{Les places de la droite projective}\label{subsection-places-of-the-projective-line}
\thingy On a vu en \ref{function-field-of-the-line} comment fabriquer
des valuations non-triviales (au-dessus de $k$) du corps $k(t)$ des
fractions rationnelles en une indéterminée sur $k$ : à savoir, si $h$
est un polynôme unitaire irréductible de $k[t]$, on appelle $v_h(f)$
l'exposant de $h$ dans la factorisation de $f$ en polynômes
irréductibles (si $f \in k[t]$, c'est bien l'exposant de la
décomposition en produit d'irréductibles, et pour une fraction
rationnelle $f/g$ on peut définir $v_h(f/g) = v_h(f) - v_h(g)$ sachant
qu'au plus un de ces termes sera non-nul lorsque $f/g$ est en forme
irréductible, cf. \ref{valuations-on-integral-domains}). Si on
préfère, au moins si $k$ est parfait, on peut aussi le noter
$v_\xi(f)$ (ou $\ord_\xi(f)$), où $\xi$ est une racine quelconque de
$h$ dans une clôture algébrique $k^{\alg}$ fixée (puisque le polynôme
$h$ se factorise dans $k^{\alg}$ comme le produit des $t-\xi_i$ où
$\xi_i$ parcourt les conjugués de $\xi$,
cf. \ref{galois-group-of-polynomial-and-permutations} et
aussi \ref{function-field-of-the-line}).
Il est facile de vérifier que ces $v_h$ sont bien des valuations au
sens de \ref{valuation-ring-versus-valuation-function} (il suffit par
exemple de vérifier les propriétés définissant une valuation sur des
polynômes, ce qui est immédiat, et de les déduire pour les fractions
rationnelles). On peut aussi vérifier directement que $\mathcal{O}_h
:= \{f \in k(t) : v_h(f) \geq 0\}$ (c'est-à-dire l'ensemble des
fractions rationnelles dont $h$ ne divise pas le dénominateur réduit)
est bien un anneau de valuation.
\thingy Le corps résiduel $\varkappa_h$ de la place $v_h$ n'est autre
que le corps de rupture $k[t]/(h)$ de $h$ sur $k$ (si $\deg h = 1$,
c'est simplement $k$). En effet, on a \textit{a priori} $\varkappa_h
= \mathcal{O}_h/(h)$
(cf. \ref{discrete-valuation-rings-are-principal}(a)) ; mais en fait
tout élément de $\mathcal{O}_h$ peut s'écrire sous la forme $f/g$ avec
$g$ non multiple de $h$, et quitte à utiliser une relation de Bézout
$u g + w h = 1$ (avec $u,w \in k[t]$), on voit que $f/g$ est la somme
de $u f \in k[t]$ et de $w\frac{f}{g} h \in h \mathcal{O}_h$, si bien
que finalement $\mathcal{O}_h/(h) = k[t]/(h)$.
Ce qu'on a appelé degré de la place $v_h$ est donc simplement le degré
de $h$ ; et les places rationnelles parmi les $v_h$ sont celles avec
$\deg h = 1$, c'est-à-dire, en fait, l'évaluation en un certain point
$x \in k$ (si $h(t) = t-x$ : on rappelle que le reste de la division
euclidienne de $f\in k[t]$ par $t-x$ est simplement $f(x)$). Plus
généralement, le paragraphe précédent montre que la valeur de $f$ en
la place $v_\xi$ définie par un $\xi \in k^{\alg}$ (c'est-à-dire par
son polynôme minimal $h$) peut s'identifier à la valeur $f(\xi)$ dans
le corps $k(\xi) = k[t]/(h)$.
\thingy Il existe une autre valuation non-triviale de $k(t)$ au-dessus
de $k$, à savoir celle qui à une fraction rationnelle $f/g$ associe la
différence $\deg(g) - \deg(f)$ du degré du dénominateur et du degré du
numérateur. On la notera $v_\infty$ (ou $\ord_\infty$).
L'anneau de valuation $\mathcal{O}_\infty$ associé est l'anneau des
fractions rationnelles dont le degré du dénominateur est supérieur ou
égal à celui du numérateur, et le corps résiduel est simplement $k$,
le morphisme d'évaluation dans $\mathcal{O}_\infty/(\frac{1}{t}) = k$
étant donné par la valeur de la fraction rationnelle en $\infty$
(telle que définie en \ref{function-field-of-the-line}). On peut s'en
convaincre en remplaçant $t$ par $\frac{1}{t}$, ce qui définit un
automorphisme de $k(t)$ transformant la place $v_0$ en $v_\infty$ et
vice versa.
On vient de construire un certain nombre de places de $k(t)$ : en
fait, ce sont les seules :
\begin{prop}\label{places-of-the-projective-line}
Soit $k$ un corps. Alors les places (=valuations non-triviales
au-dessus de $k$) du corps $k(t)$ des fractions rationnelles en une
indéterminée sont exactement les places $v_h$ (associant à $f \in
k(t)$ l'exposant de $h$ dans la factorisation de $f$ en polynômes
irréductibles) et $v_\infty$ (qui à une fraction rationnelle associe
le degré du dénominateur moins le degré du numérateur).
\end{prop}
\begin{proof}
On a vu que les places qu'on a dites en sont bien, et elles sont
visiblement distinctes. Soit maintenant $v$ une place de $k(t)$.
Considérons d'abord le cas $v(t) \geq 0$. Alors $v(f) \geq 0$ pour
tout polynôme $f \in k[t]$ (puisque $\mathcal{O}_v$ est un anneau).
Il existe nécessairement un $f \in k[t]$ tel que $v(f) > 0$ sans quoi
la valuation serait triviale. Mais si $v(f) > 0$, l'un de ses
facteurs (unitaires) irréductibles, disons $h$, vérifie aussi $v(h) >
0$. On a nécessairement $v(q) = 0$ pour tout autre polynôme unitaire
irréductible $q$ car si $v(q)$ était strictement positif, une relation
de Bézout $u q + w h = 1$ avec $u,w \in k[t]$ donnerait $v(1) > 0$ ce
qui est absurde. Bref, $h$ est le seul polynôme unitaire irréductible
dont la valuation est non-nulle, et il est alors clair que, $v(f)$
pour $f\in K$ quelconque, est le produit de $v(h)$ par l'exposant de
$h$ dans la factorisation de $f$ en polynômes irréductibles. Puisque
la valeur $1$ doit être atteinte par la valuation, on a forcément
$v(h) = 1$, et on a fini.
Considérons maintenant le cas $v(t) < 0$. Alors $v(f) = \deg f\cdot
v(t)$ pour tout polynôme $f$ (puisque le terme dominant a une
valuation strictement plus petite que n'importe quel autre terme de la
somme). On a donc $v(f/g) = (\deg f-\deg g)\,v(t)$ pour toute
fraction rationnelle $f/g$, et nécessairement $v(t) = -1$ puisque la
valeur $1$ doit être atteinte.
\end{proof}
\thingy Lorsque $k$ est algébriquement clos, les places de
$\mathbb{P}^1_k$ (:= la droite projective sur $k$, c'est-à-dire la
courbe dont le corps des fonctions est $k(t)$) peuvent donc
s'identifier aux éléments de $k$ (le point $x\in k$ étant identifié à
la valuation qui à $f \in k(t)$ associe l'ordre $v_x(f) =: \ord_x(f)$
du zéro, ou l'opposé de l'ordre du pôle, de $f$ en $x$) plus un
élément supplémentaire $\infty$ (correspondant à la valuation
$v_\infty =: \ord_\infty$ à l'infini). C'est cette vision (« la
droite des points de $k$ plus un point à l'infini ») qu'on a à
l'esprit en traitant $\mathbb{P}^1_k$ de « droite projective ».
Lorsque $k$ n'est plus supposé algébriquement clos, les places de
$\mathbb{P}^1_k$ sont un peu plus compliquées ; il faut imaginer que
chaque polynôme unitaire irréductible $h \in k[t]$ définit une place
qui correspond intuitivement à l'\emph{ensemble} de ses racines dans
la clôture algébrique : si $k$ est parfait, il s'agit exactement des
\emph{orbites} sous le groupe de Galois absolu (comparer
avec \ref{galois-group-of-polynomial-and-permutations}
et \ref{rational-and-closed-points-of-zariski-closed-sets}(3)). Par
exemple, les places de $\mathbb{P}^1_{\mathbb{R}}$ autres que $\infty$
sont soit les réels soit les \emph{paires} de complexes conjugués (en
particulier, la place associée à l'unitaire irréductible $t^2 + 1$
correspond à l'ensemble $\{\pm\sqrt{-1}\}$ de ses racines, la
multiplicité de $t^2 + 1$ dans la factorisation d'une fraction
rationnelle réelle est l'ordre du zéro ou l'opposé de l'ordre du pôle
en $+\sqrt{-1}$ ou $-\sqrt{-1}$ indifféremment).
\danger Il ne faut pas s'imaginer que la place $\infty$ soit
intrinsèquement différente des autres. Elle ne l'est qu'à cause du
choix particulier de l'indéterminée $t$ dans $k(t)$. Mais si $a,b,c,d
\in k$ sont quatre éléments de $k$ vérifiant $ad - bc = 1$, et si on
pose $t' := \frac{at+b}{ct+d} \in k(t)$, il est facile de voir que
$t'$ est aussi un transcendant et $k(t') = k(t)$ (puisqu'on peut
retrouver $t$ à partir de $t'$ par $t = \frac{dt'-b}{-ct'+a}$), et la
place qui était notée $\infty$ dans $k(t)$ devient $\frac{a}{c}$ quand
on voit ce même corps comme $k(t')$ (autrement dit, il faut comprendre
que quand $t$ « vaut » $\infty$, alors $t'$ « vaut » $\frac{a}{c}$),
et inversement la place qui est notée $\infty$ dans $k(t')$ correspond
à $-\frac{d}{c}$ dans $k(t)$. (Pour dire la même chose autrement, on
a un isomorphisme $k(t') \buildrel\sim\over\to k(t)$ donné par $f
\mapsto f(\frac{at+b}{ct+d})$, et la composition par cet isomorphisme
transforme la valuation $v_\infty$ sur $k(t)$ en la valuation
$v_{a/c}$ sur $k(t')$.) Bref, la place $\infty$ est simplement la
place où \emph{la coordonnée choisie} (i.e., le transcendant choisi
pour engendrer $k(\mathbb{P}^1_k)$) a son pôle.
\subsection{L'indépendance des valuations}\label{subsection-independence-of-valuations}
\thingy Pour comprendre le théorème suivant, il faut se rappeler que
si $v$ est une valuation, dire que $v(f-g)$ est grand signifie que $f$
et $g$ sont « très proches au sens de $v$ » : par exemple, pour des
fractions rationnelles, $v_\xi(f-g) \geq r$ signifie que les
développements limités de $f$ et $g$ en $\xi$ coïncident jusqu'à
l'ordre $r-1$ (c'est-à-dire jusqu'à un terme d'erreur
en $O((t-\xi)^r)$ si $\xi$ est fini, et en $O(t^{-r})$ si $\xi =
\infty$).
On peut d'ailleurs dire que $f$ et $g$ sont « $r$-proches pour $v$ »
lorsque $v(f-g) \geq r$, et constater qu'il s'agit d'une relation
d'équivalence compatible avec l'addition.
Le résultat suivant a donc la signification intuitive : donnés des
développements limités $f_1,\ldots,f_n$ en des places
$v_1,\ldots,v_n$, on peut trouver une unique fonction $f$ qui les
approche simultanément à n'importe quel ordre $r_i$ fixé.
\begin{thm}[« approximation faible »]\label{weak-approximation}\index{approximation faible}
Soit $K$ un corps, soient $v_1,\ldots,v_n$ des valuations discrètes
sur $K$ deux à deux distinctes, et soient $f_1,\ldots,f_n \in K$ et
$r_1,\ldots,r_n \in \mathbb{Z}$. Alors il existe $f\in K$ tel que
$v_i(f - f_i) \geq r_i$ pour chaque $i$. On peut d'ailleurs obtenir
$v_i(f - f_i) = r_i$ si on veut.
\end{thm}
\begin{proof}
On procède en plusieurs étapes.
\emph{Primo,} observons que pour chaque couple $(i,j)$ avec $i\neq j$
il existe $x \in K$ tel que $v_i(x)\geq 0$ et $v_j(x) < 0$ ou vice
versa ($v_i(x) < 0$ et $v_j(x)\geq 0$). Ceci résulte du fait que les
anneaux $\mathcal{O}_i$ et $\mathcal{O}_j$ des valuations $v_i$ et
$v_j$ sont distincts (vu que l'anneau détermine la valuation,
cf. \ref{valuation-ring-versus-valuation-function}), donc il existe
$x$ qui appartient à l'un mais pas à l'autre, c'est-à-dire $x \in
\mathcal{O}_i$ et $x \not\in \mathcal{O}_j$ ou vice versa.
\emph{Secundo,} montrons que pour chaque couple $(i,j)$ avec $i\neq j$
il existe $x \in K$ tel que $v_i(x) > 0$ et $v_j(x) < 0$. Or on vient
de voir qu'on pouvait trouver $z$ qui vérifie soit $v_i(z)\geq 0$ et
$v_j(z) < 0$ soit vice versa. Dans le premier cas, prenons $y$ tel
que $v_i(y) > 0$ : en posant $x = y z^s$, on a $v_i(x) > 0$, et
$v_j(x) = v_j(y) + s\, v_j(z)$ qui sera strictement négatif pour $s$
assez grand. Dans le second cas ($v_i(z) < 0$ et $v_j(z) \geq 0$),
prenons $y$ tel que $v_j(y)<0$ : en posant $x = y/z^s$, on a
$v_j(x)<0$, et $v_i(x) = v_i(y) - s\, v_i(z)$ qui sera strictement
positif pour $s$ assez grand vu que $v_i(z)<0$. On a donc bien trouvé
$x$ qui répond au problème posé.
\emph{Tertio,} montrons que pour chaque $i$ il existe $x \in K$ tel
que $v_i(x) > 0$ et $v_j(x) < 0$ pour \emph{chaque} $j\neq i$. On
peut sans perte de généralité supposer $i=1$ et on procède par
récurrence sur $n$ : par hypothèse de récurrence, on trouve $y$ tel
que $v_1(y) > 0$ et $v_j(y) < 0$ pour $1 0$ et $v_n(z) < 0$. On
pose $x = y + z^s$. On a déjà $v_1(x) > 0$. Pour ce qui est des
$v_j$, si $v_j(z) < 0$ (ce qui est notamment le cas de $j=n$), on a
$v_j(x) < 0$ lorsque $s$ est assez grand pour assurer $s\, v_j(z) <
v_j(y)$ ; et si au contraire $v_j(z) \geq 0$ mais que $v_j(y) < 0$, on
a aussi $v_j(x) < 0$. Donc dans tous les cas, pour $s$ assez grand,
$x$ répond aux conditions demandées.
\emph{Quarto,} montrons que pour chaque $i$ et chaque $r$ il existe $h
\in K$ tel que $v_i(h-1) \geq r$ et $v_j(h) \geq r$ pour chaque $j\neq
i$. On vient de voir qu'il existe $x \in K$ tel que $v_i(x) > 0$ et
$v_j(x) < 0$ pour chaque $j\neq i$ : on pose $h = (1+x^s)^{-1}$ pour
$s$ assez grand : on a $h-1 = x^s/(1+x^s)$ et $v_i(1+x^s) = 0$ donc
$v_i(h-1) = s\,v_i(x)$ peut être rendu arbitrairement grand ; et
$v_j(h) = -v_j(1+x^s) = -s\,v_j(x)$ peut aussi être rendu
arbitrairement grand.
\emph{Quinto,} en appelant $h_i$ un élément comme on vient de le
trouver au point précédent ($v_i(h_i-1) \geq r$ et $v_j(h_i) \geq r$
pour chaque $j\neq i$) pour un $r$ à déterminer, on pose $f = f_1 h_1
+ \cdots + f_n h_n$. On a alors $f - f_i = f_i(h_i-1) + \sum_{j\neq
i} f_j h_j$, donc $v_i(f - f_i) \geq \min_j\{v_i(f_j)\} + r$ peut
être rendu arbitrairement grand en prenant $r$ assez grand
(précisément, plus grand que $r_i - \min_j\{v_i(f_j)\}$ pour
chaque $i$). Ceci montre l'affirmation principale du théorème.
\emph{Sexto,} si on souhaite obtenir $v_i(f - f_i) = r_i$ exactement,
on choisit $z_i$ tel que $v_i(z_i) = r_i$ exactement, puis on utilise
le point précédent pour trouver $g$ tel que $v_i(g - f_i) > r_i$ pour
chaque $i$, et une nouvelle fois pour trouver $z$ tel que $v_i(z -
z_i) > r_i$ pour chaque $i$ : alors $f := g+z$ vérifie $v_i(f - f_i) =
v_i((g - f_i) + (z - z_i) + z_i)$, or $v_i(z_i) = r_i$ et $v_i(g -
f_i) > r_i$ et $v_i(z - z_i) > r_i$, si bien que $v_i(f - f_i) = r_i$
comme souhaité.
\end{proof}
\begin{cor}
L'ensemble $\mathscr{V}_{K/k}$ des places d'un corps $K$ de fonctions
de courbe sur $k$ est infini.
\end{cor}
\begin{proof}
On a vu en \ref{valuations-on-curves-are-discrete} que tous les
éléments de $\mathscr{V}_{K/k}$ sont des valuations \emph{discrètes}.
Si cet ensemble était fini, disons $\mathscr{V}_{K/k} =
\{v_1,\ldots,v_n\}$, d'après le résultat \ref{weak-approximation}
qu'on vient de montrer, il existerait $f \in K$ tel que $v_i(f) = 1$
pour tout $i$, c'est-à-dire $v(f) = 1$ pour toute place $v \in
\mathscr{V}_{K/k}$. Un tel $f$ contredit l'équivalence
en \ref{constant-functions-on-a-curve} (une fonction qui n'a aucun
pôle doit être constante, mais une fonction constante est soit
identiquement nulle soit n'a pas de zéro non plus).
\end{proof}
\subsection{L'identité du degré}\label{subsection-degree-identity}
\begin{lem}\label{dimension-degree-bound-lemma}
Soit $K$ un corps de fonctions de courbe sur $k$, soient
$v_1,\ldots,v_n$ des places de $K$ sur $k$ deux à deux distinctes, et
soient $r_1,\ldots,r_n \in \mathbb{N}$. Si $v$ est une place de $K$,
posons $r_v = r_i$ si $v = v_i$ et $r_v = 0$ si $v$ n'est pas l'une
des $v_i$. On considère le $k$-espace vectoriel
\[
L := \{f \in K : (\forall v)\, v(f) \geq -r_v\}
\]
des fonctions $f \in K$ qui ont en $v_i$ un pôle de multiplicité au
plus $r_i$ et aucun pôle ailleurs qu'en $v_1,\ldots,v_n$.
Alors la dimension de $L$ est $\leq [\tilde k : k] + \sum_{i=1}^n
r_i\, \deg(v_i)$ où on rappelle que $\deg(v_i)$ (degré de la
place $v_i$, cf. \ref{degree-of-a-place}) est $\dim_k(\varkappa_i)$
avec $\varkappa_i := \mathcal{O}_i/\mathfrak{m}_i$ le corps résiduel
de $v_i$, et où $\tilde k$ est le corps des constantes (fermeture
algébrique de $k$ dans $K$, cf. \ref{constant-functions-on-a-curve}).
Plus exactement, la dimension de $L$ est $[\tilde k:k]$ lorsque tous
les $r_i$ sont nuls, et augmente d'au plus $\deg(v_i)$ lorsque $r_i$
est augmenté de $1$.
En particulier, cette dimension est \emph{finie}.
\end{lem}
\begin{proof}
On procède par récurrence sur $\sum_{i=1}^n r_i$. Si les $r_i$ sont
tous nuls, $L = \{f\in K : (\forall v)\, v(f) \geq 0\}$ est
précisément $\tilde k$
(cf. \ref{valuation-rings-and-integral-closure}), donc la formule est
vérifiée dans ce cas.
Supposons l'inégalité vérifiée pour certains $r_j$ et montrons qu'elle
l'est encore quand on remplace l'un d'entre eux, disons $r_i$,
par $r'_i := r_i+1$, avec $r'_j = r_j$ si $j\neq i$. Soit $L'$
l'espace correspondant (défini de la même façon que $L$ mais avec
les $r'_j$). Soit $z$ tel que $v_j(z) = r_j+1$. Alors pour $f \in
L'$ on a $v_j(fz) \geq 0$, c'est-à-dire $fz \in \mathcal{O}_i$, et de
plus $fz \in \mathfrak{m}_i$ se produit exactement lorsque
$v_j(fz)\geq 1$ c'est-à-dire que $f \in L$. On a donc défini une
application $k$-linéaire $L'\to\varkappa_i$ envoyant $f$ sur la classe
de $fz \in \mathcal{O}_i$ modulo $\mathfrak{m}_i$, dont le noyau
est $L$. En particulier, $\dim_k(L') \leq \dim_k(\varkappa_i) +
\dim_k(L) \leq [\tilde k : k] + \sum_{i=1}^n r'_i\, \deg(v_i)$, ce qui
conclut la récurrence ; et on a bien montré l'affirmation commençant
par « plus exactement ».
\end{proof}
\begin{thm}[« identité du degré »]\label{degree-identity}
Soit $K$ un corps de fonctions de courbe sur $k$, soit $x \in K$ non
constant (cf. \ref{constant-functions-on-a-curve}) : alors l'ensemble
des places où $x$ a un zéro (c'est-à-dire $v(x) > 0$) est fini, et si
on les note $v_1,\ldots,v_n$, on a :
\[
\sum_{i=1}^n v_i(x)\,\deg(v_i) = [K : k(x)]
\]
\end{thm}
(Rappelons que $[K : k(x)]$ est fini,
cf. \ref{key-lemma-on-valuations-of-a-curve}(A).)
\begin{proof}
Les deux inégalités se démontrent indépendamment. Dans
l'inégalité $\leq$, on n'utilisera pas le fait que $v_1,\ldots,v_n$
soient \emph{toutes} les places où $x$ a un zéro, ce qui prouvera, en
particulier, qu'il y en a bien un nombre fini (majoré par $[K :
k(x)]$).
\emph{Montrons d'abord l'inégalité $\leq$.}
Pour chaque $i$, soit $d_i := \deg(v_i)$ et $r_i := v_i(x)$, et soient
$z_{i,1},\ldots,z_{i,d_i} \in \mathcal{O}_i$ dont les classes
modulo $\mathfrak{m}_i$ forment une base de $\varkappa_i$ comme
$k$-espace vectoriel (notamment $v_i(z_{i,u}) = 0$). Quitte à
utiliser le théorème \ref{weak-approximation} on peut, sans changer
cette propriété des $z_{i,u}$, assurer de surcroît que $v_j(z_{i,u})
\geq r_j$ pour tout $j\neq i$. On choisit enfin $t_i$ tel que
$v_i(t_i) = 1$ et $v_j(t_i) = 0$ si $j\neq i$ (de nouveau en
utilisant \ref{weak-approximation}). On va montrer que les $z_{i,u}
t_i^s$ pour $1\leq i\leq n$ et $1\leq u\leq d_i$ et $0\leq s < r_i$
sont linéairement indépendants sur $k(x)$, ce qui, comme leur nombre
est $\sum_{i=1}^n r_i d_i$, donnera bien l'inégalité $\leq$.
Supposons donc qu'on ait une relation linéaire non-triviale
\[
\sum_{j=1}^n \sum_{u=1}^{d_j} \sum_{s=0}^{r_j-1} f_{j,u,s} z_{j,u} t_j^s = 0
\]
avec $f_{j,u,s} \in k(x)$. On sait que $x$ est transcendant sur $k$,
c'est-à-dire que les $f_{j,u,s}$ sont des fractions rationnelles
en $x$. Quitte à chasser les dénominateurs, on peut supposer
$f_{j,u,s} \in k[x]$ et que $x$ ne les divise pas tous. Soit $e$ le
plus petit $s$ tel que l'un des $f_{j,u,e}$ ne soit pas divisible
par $x$ (i.e., non nul en $0$) et soit $i$ correspondant (i.e., un
indice tel que l'un des $f_{i,u,e}$ ne soit pas divisible par $x$).
On a $\sum_{j=1}^n \sum_{u=1}^{d_j} \sum_{s=0}^{r_j-1} f_{j,u,s}
z_{j,u} t_j^s t_i^{-e} = 0$. Considérons la valuation $v_i$ du terme
$f_{j,u,s} z_{j,u} t_j^s t_i^{-e}$, qui vaut $v_i(f_{j,u,s}) +
v_i(z_{j,u}) + s\, v_i(t_j) - e$. Remarquons que $v_i(f_{j,u,s}) \geq
0$ puisque $f_{j,u,s} \in k[x]$. On considère plusieurs cas :
\begin{itemize}
\item si $j\neq i$, on a $v_i(z_{j,u}) \geq r_i$ et $v_i(t_j) = 0$
donc la valuation considérée est au moins $0 + r_i + 0 - e > 0$ ;
\item lorsque $j = i$ (si bien que $v_i(z_{i,u}) = 0$) et $s < e$, on
a $f_{j,u,s} = x g_{j,u,s}$ pour un certain $g\in k[x]$, la
valuation considérée vaut au moins $r_i + 0 + s - e > 0$ car $e <
r_i$ ;
\item lorsque $j = i$ et $s > e$, la valuation considérée vaut au
moins $0 + 0 + s - e > 0$
\item reste les termes où $j = i$ et $s = e$, où la valuation
considérée vaut au moins $0 + 0 + s - e = 0$.
\end{itemize}
Bref, tous les termes de la somme sont dans $\mathcal{O}_i$ et tous
ceux où $j\neq i$ ou bien $s\neq e$ sont dans $\mathfrak{m}_i$. En
réduisant modulo $\mathfrak{m}_i$, on obtient donc
\[
\sum_{u=1}^{d_i} f_{i,u,e}(0)\, z_{i,u}(v_i) = 0 \in \varkappa_i
\]
(où $z_{i,u}(v_i)$ est la réduction de $z_{i,u}$
modulo $\mathfrak{m}_i$) et au moins un des $f_{i,u,e}(0)$ est non
nul. Mais ceci contredit l'indépendance linéaire sur $k$ des
$z_{i,u}(v_i) \in \varkappa_i$.
\emph{Montrons maintenant l'inégalité $\geq$.}
Soit $m := [K:k(x)]$ et soit $z_1,\ldots,z_m$ une base de $K$
comme $k(x)$-espace vectoriel. Ajoutons aux $v_i$ toutes les places
où l'un des $z_j$ a un pôle, et posons $r_i = \max(v_i(x),0)$
(c'est-à-dire $r_i = v_i(x)$ pour les $v_i$ de départ et $r_i = 0$
pour les nouveaux), et aussi $s_i = \max(\max_j\{v_i(z_j)\},0)$. Soit
enfin $L_N$ l'espace vectoriel $\{f \in K : (\forall i)\, v_i(f_i)
\geq -(s_i + N r_i)\}$ : on a alors $x^{-\ell} z_j \in L_N$ pour tout
$j$ et tout $0\leq \ell \leq N$, et les $x^{-\ell} z_j$ sont
linéairement indépendants sur $k$ (puisque $x$ est transcendant
d'après \ref{constant-functions-on-a-curve} et que les $z_j$ sont
linéairement indépendants sur $k(x)$). D'après le
lemme \ref{dimension-degree-bound-lemma}, on en déduit $N \sum_i
r_i\,\deg(v_i) + C \geq (N+1) m$ où $C$ est une constante (à savoir
$\sum_i s_i\,\deg(v_i) + [\tilde k:k]$). Or ceci n'est possible, pour
$N$ grand, que si $\sum_i r_i\,\deg(v_i) \geq m$, ce qui montre
l'inégalité annoncée.
\end{proof}
\begin{cor}\label{valuation-of-function-is-almost-everywhere-zero}
Soit $K$ un corps de fonctions de courbe sur $k$, soit $x \in K$ non
nul. Alors l'ensemble des places où $x$ a un zéro ou un pôle est
fini.
\end{cor}
\begin{proof}
Si $x$ est constante (cf. \ref{constant-functions-on-a-curve}), le
résultat est trivial (l'ensemble des pôles est vide, et l'ensemble des
zéros est vide si $x\neq 0$). Si $x$ n'est pas constant, le
théorème \ref{degree-identity} montre que l'ensemble des zéros a pour
cardinal au plus $[K : k(x)]$, qui est fini ; et pour ce qui est des
pôles, il suffit de remplacer $x$ par $x^{-1}$.
\end{proof}
\thingy L'identité du degré généralise le fait qu'un polynôme de
degré $d$ a au plus $d$ zéros, et même exactement $d$ si on compte les
zéros avec multiplicité dans une clôture algébrique. Pour voir le
rapport, considérons $h \in k[t]$ de degré $d > 0$ : alors $h$ (vu
comme un élément de $k(t)$) est transcendant sur $k$ d'après
\ref{key-lemma-on-valuations-of-a-curve}(A), mieux, l'extension $k(h)
\subseteq k(t)$ est algébrique de degré $d$. En effet, $t$ est racine
du polynôme $h(u) - h \in k(h)[u]$ de degré $d$ en
l'indéterminée $u$ ; et pour montrer que $1,\ldots,t^{d-1}$ sont
linéairement indépendants sur $k(h)$, supposons que $z_0 + z_1 t +
\cdots + z_{d-1} t^{d-1} = 0$ avec $z_i \in k(h)$, disons $z_i =
f_i\circ h$ où $f_i \in k(u)$, quitte à chasser les dénominateurs on
peut supposer $f_i \in k[u]$ non tous multiples de $u$ et quitte à
écrire $f_i = c_i + u g_i$ où $c_i = f_i(0) \in k$ non tous nuls et
$g_i \in k[u]$, c'est-à-dire $z_i = c_i + h\cdot g_i\circ h$, et on a
$c_0 + c_1 t + \cdots + c_{d-1} t^{d-1} \in k[t]/(h)$, ce qui est
impossible. Bref, $[k(t) : k(h)] = \deg h$ dans ce cas, et l'énoncé
du théorème \ref{degree-identity} est que $\sum_{i=1}^n v_i(h)\,
\deg(v_i) = \deg h$ où les $v_i$ sont les places où $h$ a un zéro ;
d'après la section \ref{subsection-places-of-the-projective-line}, les
$v_i(h)$ sont les multiplicités des facteurs irréductibles $h_i$
divisant $h$ (i.e., « où $h$ a un zéro »), et les $\deg(v_i)$ sont les
degrés des facteurs $h_i$ en question.
Si $h \in k(t)$ est une fraction rationnelle, la même formule permet
de voir que $[k(t) : k(h)]$ est égal à la somme des $v_i(h)\,
\deg(v_i)$ comme précédemment, c'est-à-dire le degré du numérateur,
plus éventuellement la contribution de la place $\infty$ (si
$v_\infty(h)\geq 0$), pour laquelle $\deg(v_\infty) = 1$ et
$v_\infty(h)$ est le degré du dénominateur moins celui du numérateur.
Autrement dit, le terme de gauche de l'égalité du
théorème \ref{degree-identity} est le \emph{maximum} du degré du
numérateur et du degré du dénominateur : il est raisonnable de définir
ainsi le degré d'une fraction rationnelle.
En s'inspirant de ces cas particuliers, on fait la définition générale
suivante :
\begin{defn}\label{degree-of-a-function}
Soit $K$ un corps de fonctions de courbe sur $k$ et soit $h\in K$ :
alors on pose $\deg(h) = [K : k(h)]$ si $h$ est non constant, et
$\deg(h) = 0$ si $h$ est constante (\defin[degré (d'une fonction sur
une courbe)]{degré} de $x$). Ainsi, le
théorème \ref{degree-identity} se réécrit :
\[
\sum_{i=1}^n v_i(h)\,\deg(v_i) = \deg(h)
\]
dès que $h \neq 0$, où $v_1,\ldots,v_n$ sont les places où $h$ a un
zéro.
\end{defn}
On a vu ci-dessus que si $h$ est un polynôme, $\deg h$ est bien le
degré au sens usuel, et si $h$ est une fraction rationnelle, $\deg h$
est le maximum du degré du numérateur et du dénominateur.
\subsection{Diviseurs sur les courbes}\label{subsection-divisors-on-curves}
\begin{defn}
Soit $K = k(C)$ un corps de fonctions de courbe sur $k$. Un
\defin{diviseur} sur la courbe $C$ est une combinaison linéaire
formelle à coefficients entiers de $k$-places de $K$ : autrement dit,
le groupe $\Divis(C)$ des diviseurs est défini comme le groupe abélien
libre $\bigoplus_{P\in\mathscr{V}_{K/k}} \mathbb{Z}$ de base
l'ensemble $\mathscr{V}_{K/k}$ des places de $C$. On notera $\sum_P
n_P (P)$ une telle combinaison (où $P$ parcourt les places de $C$ et
les $n_P$ sont des entiers relatifs tous nuls sauf un nombre fini).
Le \defin[degré (d'un diviseur)]{degré} d'un diviseur $D = \sum_P n_P
\cdot (P)$ est défini comme $\deg(D) := \sum_P n_P \deg(P)$ où
$\deg(P)$ est le degré de la place $P$ (cf. \ref{degree-of-a-place}).
On notera $\Divis^0(C)$ le sous-groupe des diviseurs de degré zéro
(i.e., le noyau de $\deg$).
Un diviseur $D$ est dit \defin[effectif (diviseur)]{effectif} (ou
abusivement : « positif ») lorsque tous les coefficients $n_P$ sont
positifs. On note $D \geq 0$ pour cette affirmation.
\end{defn}
\begin{defn}
Si $K = k(C)$ est un corps de fonctions de courbe sur $k$, et si $f \in
K$ est non nulle, on appelle respectivement \textbf{diviseur des
zéros}, \textbf{diviseur des pôles} et \defin[principal
(diviseur)]{diviseur principal} associés à la fonction $f$ les
diviseurs
\[
\begin{aligned}
f^*((0)) &:= \sum_{P\;:\;\ord_P(f) > 0} \ord_P(f)\cdot (P)\\
f^*((\infty)) &:= \sum_{P\;:\;\ord_P(f) < 0} -\ord_P(f)\cdot (P)\\
\divis(f) := f^*((0)-(\infty)) &= \sum_P \ord_P(f)\cdot (P)\\
\end{aligned}
\]
où $\ord_P$ (aussi noté $v_P$) est la valuation
correspondant\footnote{Formellement, avec la présentation utilisée
ici, $\ord_P = v_P$ et $P$ sont \emph{égaux}. Il est cependant
utile de les distinguer (pour la clarté des notations ou pour la
vision géométrique des choses), et d'appeler $P$ une « place » de la
courbe (voire, un « point fermé »), et $\ord_P$ la « valuation en la
place $P$ » ou « valuation correspondant à la
place $P$ ».\label{footnote-place-versus-valuation}} à la
place $P$ (i.e., l'ordre [du zéro] en $P$ de $f$).
\end{defn}
\thingy Le théorème \ref{degree-identity} affirme que le degré du
diviseur des zéros $f^*((0))$ ou du diviseur des pôles $f^*((\infty))$
de $f$ est égal au degré de l'extension $k(f) \subseteq K$, qu'on peut
appeler simplement « degré » de $f$. Le degré du diviseur principal
$\divis(f)$, qui est égal au degré du diviseur des zéros moins le
diviseur des pôles, est donc nul : $\divis(f) \in \Divis(C)^0$.
Il faut souligner que $\divis(fg) = \divis(f) + \divis(g)$ d'après la
propriété \ref{valuation-ring-versus-valuation-function}(i) des
valuations : $\divis$ définit donc un morphisme $K^\times \to
\Divis(C)$ (dont le noyau est le groupe $\tilde k^\times$ des
constantes non nulles).
Si $D = \sum_P n_P\cdot (P)$ est un diviseur, certains appellent
« valuation » ou « ordre » ou « multiplicité » de $D$ en $P$ l'entier
$n_P$ (ce qui fait donc que la valuation de $\divis(f)$ en $P$ est par
définition exactement la valuation $\ord_P(f)$ de $f$ en $P$). On
évitera d'abuser de cette terminologie.
\begin{defn}\label{definition-linear-equivalence-and-picard-group}
Si $K = k(C)$ est un corps de fonctions de courbe sur $k$, on appelle
\defin[principal (diviseur)]{diviseur principal} un diviseur sur $C$
(forcément de degré zéro, comme on l'a vu) de la forme $\divis(f) :=
\sum_P \ord_P(f)\cdot (P)$ pour une certaine fonction $f \in k(C)$ non
nulle. Les diviseurs principaux forment un sous-groupe du groupe des
diviseurs, et même des diviseurs de degré zéro : on dit que deux
divieurs $D$ et $D'$ sont \defin[linéairement équivalents
(diviseurs)]{linéairement équivalents}, et on note $D \sim D'$,
lorsque leur différence $D'-D$ est un diviseur principal. Le groupe
des diviseurs (resp. diviseurs de degré $0$) modulo les diviseurs
principaux (=modulo équivalence linéaire) s'appelle \defin[Picard
(groupe de)]{groupe de Picard} (resp. groupe de Picard de degré
zéro) de la courbe $C$, et est noté $\Pic(C)$ (resp. $\Pic^0(C)$).
\end{defn}
\thingy\label{picard-group-of-the-projective-line}
À titre d'exemple, calculons le groupe de Picard de la droite
projective $\mathbb{P}^1_k$ sur un corps $k$. On a vu
en \ref{subsection-places-of-the-projective-line} que les places
de $\mathbb{P}^1_k$ sont en correspondance avec les polynômes
unitaires irréductibles de $k[t]$, plus une place « à
l'infini » $\infty$. Disons qu'on note $P_h$ la place correspondant
à la valuation $v_h$, pour $h$ unitaire irréductible, qui vérifie
$\deg P_h = \deg h$ ; pour $h$ de degré un, c'est-à-dire de la forme
$t - x$, on peut noter simplement $x$ la place en question (i.e.,
$v_x(f) = \ord_x(f)$ est l'ordre du zéro, ou l'opposé de l'ordre du
pôle, d'une fonction rationnelle $f$ en $x$).
Si $D = n_\infty (\infty) + \sum_h n_h\cdot(P_h) \in
\Divis(\mathbb{P}^1_k)$ est un diviseur sur $\mathbb{P}^1_k$ (où
$n_\infty$ et les $n_h$ sont des entiers, et tous les $n_h$ sont nuls
sauf un nombre fini), on peut définir une fonction $f := \prod_h
h^{n_h}$ qui vérifie $v_h(f) = n_h$ par construction, donc $\divis(f)
= n'_\infty (\infty) + \sum_h n_h\cdot (P_h)$ où $n'_\infty = -\sum_h
n_h \deg(h)$ est la valuation $v_\infty(f)$ puisque $v_\infty(h) =
-\deg(h)$. Les diviseurs $D$ et $\divis(f)$ ne diffèrent donc que par
$(n_\infty - n'_\infty) \cdot(\infty)$, et ce diviseur est nul si en
fait $D \in \Divis^0(\mathbb{P}^1_k)$ (c'est-à-dire que le degré
$n_\infty + \sum_h n_h \deg(h) = n_\infty - n'_\infty$ de $D$ est
nul). Ceci prouve que tout diviseur est linéairement équivalent à un
multiple de $(\infty)$ et que les diviseurs de degré zéro sur
$\mathbb{P}^1_k$ sont exactement les diviseurs principaux. Autrement
dit, $\Pic(\mathbb{P}^1_k) = \mathbb{Z}$ (l'isomorphisme étant donné
par le degré) et $\Pic^0(\mathbb{P}^1_k) = 0$.
\subsection{Espaces de Riemann-Roch}\label{subsection-riemann-roch-spaces}
\begin{defn}
Soit $K = k(C)$ un corps de fonctions de courbe sur $k$, et soit $D =
\sum_P n_P \cdot (P)$ un divisuer sur $C$ (c'est-à-dire la donnée d'un
entier $n_P$ pour chaque place de $P$, tous nuls sauf un nombre fini).
On appelle \defin[Riemann-Roch (espace de)]{espace de Riemann-Roch}
associé au diviseur $D$ le $k$-espace vectoriel
\[
\begin{aligned}
\mathscr{L}(D) &:= \{f \in K : (\forall P)\, \ord_P(f) \geq -n_P\}\\
&= \{f \in K^\times : \divis(f) + D \geq 0\} \cup \{0\}\\
\end{aligned}
\]
des fonctions rationnelles sur $C$ qui ont en chaque place $P$ un pôle
d'ordre au plus $n_P$ (ou un zéro d'ordre au moins $n_P$ dans le cas
où $n_P$ est strictement négatif ; et pas de pôle si $n_P$ est nul).
Ici, $\ord_P(f)$ désigne la valuation de $f$
correspondant\footnote{Voir note \ref{footnote-place-versus-valuation}
page \pageref{footnote-place-versus-valuation}.} à la place $P$,
c'est-à-dire le coefficient de $P$ dans $\divis(f)$.
On note $\ell(D)$ la dimension de $\mathscr{L}(D)$ comme $k$-espace
vectoriel (on va rappeler qu'elle est toujours finie).
\end{defn}
\begin{prop}
En notant $D$ et $D'$ des diviseurs sur une même courbe :
(o) Si $\mathscr{L}(D) \neq 0$ alors il existe $D'$ linéairement
équivalent à $D$
(cf. \ref{definition-linear-equivalence-and-picard-group}) et
effectif.
(i.a) En notant $0$ le diviseur nul, on a $\mathscr{L}(0) = \tilde k$.
(i.b) Si $D < 0$ (au sens où $-D$ est effectif et non nul), on a
$\mathscr{L}(D) = 0$.
(ii) Si $D$ et $D'$ sont linéairement équivalents ($D \sim D'$),
c'est-à-dire si $D' - D = \divis(f)$ pour une certaine fonction $f$
alors on a un isomorphisme $\mathscr{L}(D') \buildrel\sim\over\to
\mathscr{L}(D)$ donné par $g \mapsto fg$. En particulier,
$\mathscr{L}(D')$ et $\mathscr{L}(D)$ ont même dimension $\ell(D') =
\ell(D)$.
(iii) Si $D \leq D'$ (au sens où $D' - D$ est effectif) alors
$\mathscr{L}(D) \subseteq \mathscr{L}(D')$ et la dimension du
$k$-espace vectoriel $\mathscr{L}(D')/\mathscr{L}(D)$ est au
plus $\deg D' - \deg D$.
(iv) Le $k$-espace vectoriel $\mathscr{L}(D)$ est de dimension finie :
plus précisément, si $D = D_+ - D_-$ avec $D_+$ et $D_-$ effectifs,
alors $\ell(D) \leq [\tilde k:k] + \deg D_+$.
\end{prop}
\begin{proof}
(o) Si $f \in \mathscr{L}(D)$ alors $D' := \divis(f) + D$ est effectif
(par définition de $\mathscr{L}(D)$) et linéairement équivalent
à $D$ (par définition de l'équivalence linéaire).
(i) découle de \ref{constant-functions-on-a-curve} (une fonction sans
pôle, c'est-à-dire un élément de $\mathscr{L}(0)$, est constante, et
elle n'a pas non plus de zéro, c'est-à-dire n'appartient pas à
$\mathscr{L}(D)$ pour $D<0$, sauf si elle est nulle).
(ii) Il suffit de constater que si $D' = D + \divis(f)$ alors
$\divis(g) + D' \geq 0$ équivaut à $\divis(fg) + D \geq 0$ puisque
les membres de gauche sont égaux (vu que $\divis(fg) = \divis(f) +
\divis(g)$).
(iii) (sauf l'affirmation $\mathscr{L}(D) \subseteq \mathscr{L}(D')$,
qui est triviale), et (iv) pour $D_- = 0$, sont une reformulation
de \ref{dimension-degree-bound-lemma}. Le cas général de (iv) s'en
déduit trivialement (augmenter $D_-$ ne peut que faire
diminuer $\ell(D)$).
\end{proof}
\begin{prop}\label{negative-degree-divisors-have-no-sections}
En notant $D$ un diviseur sur une courbe :
\begin{itemize}
\item Si $\deg D < 0$ alors $\ell(D) = 0$.
\item Si $\deg D = 0$ et $\ell(D) \neq 0$ alors $\ell(D) = [\tilde k :
k]$ et $D \sim 0$.
\end{itemize}
\end{prop}
\begin{proof}
Dire que $\ell(D) \neq 0$ signifie que pour un certain $f$ on a $D' :=
\divis(f) + D \geq 0$. Or le degré de $\divis(f)$ est nul (et le
degré d'un diviseur effectif $D'$ est évidemment positif), donc le
degré de $D$ est $\geq 0$. De plus, si le degré de $D$ (donc de $D'$)
est nul, cela signifie que $\divis(f) + D = 0$, c'est-à-dire $D \sim
0$, qui entraîne $\ell(D) = 1$.
\end{proof}
\subsection{Différentielles de Kähler}\label{subsection-kaehler-differentials}
\begin{defn}\label{definition-kaehler-differentials}
Soit $k$ un corps (ou même un anneau) et $A$ une $k$-algèbre. On
appelle espace des \defin{différentielles de Kähler} de $A$ sur $k$,
et on note $\Omega^1_{A/k}$, le $A$-module engendré par des symboles
formels $dx$ (ou $d_A x$ si on veut être plus précis) pour chaque $x
\in A$, sujets aux relations :
\begin{itemize}
\item[(i)] $d(x+x') = dx + dx'$ si $x,x'\in A$, et $d(cx) = c\,dx$ si
$c\in k$ et $x\in A$ (i.e., $d\colon A \to \Omega^1_{A/k}$
est $k$-linéaire), et
\item[(ii)] $d(xy) = x\, dy + y\, dx$ si $x,y \in A$
\end{itemize}
(autrement dit, $\Omega^1_{A/k}$ est le quotient du $A$-module libre
de base $\{dx : x\in A\}$ par le sous-module engendré par les
relations qu'on vient de dire, autrement dit les $d(x+x') - dx -dx'$
pour $x,x'\in A$, les $d(cx) - c\,dx$ pour $c\in k$ et $x\in A$ et les
$d(xy) - x\,dy - y\,dx$ pour $x,y\in A$).
\end{defn}
\thingy Cette définition n'est pas très élégante. Une définition plus
satisfaisante serait de dire que $d\colon A \to \Omega^1_{A/k}$ a la
propriété « universelle » que toute autre application $\delta\colon A
\to M$ (où $M$ est un $A$-module) $k$-linéaire vérifiant $\delta(xy) =
x\,\delta(y) + y\,\delta(x)$ (on dit que $\delta$ est une
\defin{dérivation} de $A$ à valeurs dans $M$) se factorise de façon
unique par $d$ (i.e., il existe une application $A$-linéaire $u\colon
\Omega^1_{A/k}\to M$ unique tel que $\delta(x) = u(dx)$). Il est
purement formel de vérifier que cette propriété caractérise
complètement $\Omega^1_{A/k}$, et est bien vérifiée de l'objet
construit en \ref{definition-kaehler-differentials}.
Pour une extension de corps $k \subseteq K$, le $K$-module
$\Omega^1_{K/k}$ est facile à décrire, à condition de faire une
hypothèse de séparabilité que nous énonçons maintenant.
\begin{prop}\label{separable-iff-separating-transcendence-basis}
Soit $k \subseteq K$ une extension de corps de type fini. Les
propriétés suivantes sont équivalentes :
\begin{itemize}
\item si la caractéristique est $p>0$, alors dans $K$, les corps $K^p$
et $k$ sont linéairement disjoints sur $k^p$
(cf. \ref{definition-linear-disjointness} ; lire : les extensions
$k^p \subseteq K^p$ et $k^p \subseteq k$, tous deux contenues
dans $K$, sont linéairement disjointes),
\item il existe une base de transcendance $(t_1,\ldots,t_n)$ pour
laquelle $K$ est (algébrique) \emph{séparable}
sur $k(t_1,\ldots,t_n)$
(cf. \ref{definition-separable-algebraic-extension}).
\end{itemize}
(Plus généralement, si on ne suppose plus $k \subseteq K$ de type
fini, la première condition est équivalente à la seconde affirmée pour
toutes les sous-extensions de type fini $k \subseteq K_0$ de $K$.)
\end{prop}
\begin{proof}[Références]
\cite[théorèmes 26.1 et 26.2]{Matsumura1989}
\end{proof}
\thingy\label{separable-not-necessarily-algebraic-field-extensions}
Lorsque ces deux conditions équivalentes sont satisfaites, on dit que
l'extension $k \subseteq K$ (non nécessairement algébrique !) est
\defin[séparable (extension)]{séparable}. (Il va de soi, en vertu de
la seconde condition, que pour une extension algébrique, on retrouve
la définition de « séparable » donnée
en \ref{definition-separable-algebraic-extension} ; comparer aussi
avec \ref{linear-criterion-for-separability} pour la première
condition ci-dessus dans le cas d'une extension algébrique.) Dans les
conditions de la seconde condition, on dit aussi que
$(t_1,\ldots,t_n)$ est une base de transcendance \defin[séparante
(base de transcendance)]{séparante}.
\thingy\label{discussion-separability-of-function-fields} Toute
extension de corps en caractéristique $0$ est séparable (la première
condition de \ref{separable-iff-separating-transcendence-basis} doit
se lire comme trivialement vraie en caractéristique $0$). Plus
généralement, lorsque $k$ est \emph{parfait}
(cf. \ref{definition-perfect-field} ; par exemple, un corps fini),
\emph{toute} extension $k \subseteq K$, algébrique ou non, est
séparable
d'après \ref{separating-transcendence-basis-over-perfect-field} (qui
généralise donc la
remarque \ref{field-is-perfect-iff-every-algebraic-is-separable}).
Une autre condition suffisante pour que $k \subseteq K$ soit séparable
est que $K$ et $k^{\alg}$ soient linéairement disjoints au-dessus
de $k$ dans $K^{\alg}$ (on parle d'extension \defin[régulière
(extension)]{régulière} dans ce contexte ; il est facile de voir, en
utilisant le fait que le Frobenius est un automorphisme de $K^{\alg}$,
que ceci implique la première condition
de \ref{separable-iff-separating-transcendence-basis}). Ceci
s'applique lorsque $K$ est le corps de fonctions d'un fermé de Zariski
\emph{géométriquement} irréductible
(cf. \ref{geometric-irreducibility},
et \ref{function-field-of-an-irreducible-set}).
\underline{On retiendra donc surtout ceci :} si $K = k(C)$ est le
corps des fractions d'une courbe sur un corps $k$ et qu'\emph{au moins
une} des hypothèses suivantes est satisfaite :
\begin{itemize}
\item le corps de base $k$ est parfait,
\item la courbe $C$ est géométriquement irréductible (par exemple, $C$
est défini dans le plan par l'annulation d'un polynôme $P$
géométriquement irréductible, c'est-à-dire irréductible
sur $k^{\alg}$,
cf. \ref{example-curve-irreducible-but-not-geometrically}, ou plus
généralement par un fermé de Zariski géométriquement irréductible,
cf. \ref{function-field-of-an-irreducible-set}),
\end{itemize}
alors l'extension $k \subseteq K$ est séparable. On fera cette
hypothèse à chaque fois qu'il sera question de différentielles sur une
courbe.
Beaucoup d'auteurs limitent la notion de « corps de fonctions de
courbe » à ceux qui sont séparables sur le corps de base, voire, les
corps de fonctions de courbes géométriquement irréductibles : on
pourrait donc en faire de même.
\danger L'hypothèse « $k$ parfait » simplifie beaucoup de choses, mais
elle ne trivialise pas pour autant \emph{toutes} les questions de
séparabilité : notamment, même si $k$ est parfait, il n'est pas vrai
que toute base de transcendance de $K$ sur $k$ soit automatiquement
une base de transcendance séparante (contre-exemple : en
caractéristique $p>0$, si $k(t)$ désigne le corps des fractions
rationnelles, $t^p$ est une base de transcendance de $k(t)$ sur $k$,
et pourtant elle n'est pas séparante, car l'extension $k(t^p)
\subseteq k(t)$ n'est pas séparable).
\begin{prop}\label{differentials-of-separable-field-extension}
Soit $k \subseteq K$ une extension de corps de type fini et séparable.
Si $(t_1,\ldots,t_n)$ une base de transcendance séparante (i.e., telle
que $K$ est algébrique séparable sur $k(t_1,\ldots,t_n)$,
cf. \ref{separable-not-necessarily-algebraic-field-extensions}), alors
$\Omega^1_{K/k}$ est un $K$-espace vectoriel de base
$dt_1,\ldots,dt_n$. Réciproquement, si $t_1,\ldots,t_n \in K$ sont
tels que $dt_1,\ldots,dt_n$ soient linéairement indépendants sur $K$,
alors ils sont une base de transcendance séparante.
\end{prop}
\begin{proof}[Références]
\cite[théorèmes 26.6 et 26.8]{Matsumura1989},
\cite[lemme 2.8.3]{FriedJarden2008}
\end{proof}
\thingy En particulier, si $K = k(C)$ est un corps de fonctions de
courbe sur $k$, séparable
(cf. \ref{discussion-separability-of-function-fields}), alors
\emph{$\Omega^1_{K/k}$ est un $K$-espace vectoriel de dimension $1$},
et une base (c'est-à-dire, un élément non nul) en est donnée par $dt$
pour n'importe quel $t\in K$ qui soit une base de transcendance
séparante, autrement $t$ non constant et $k(t) \subseteq K$
(algébrique) séparable.
Si $t$ est un tel élément, c'est-à-dire que tout élément $\omega$ de
$\Omega^1_{K/k}$ est multiple de $dt$ par un coefficient uniquement
défini, on peut noter $\frac{\omega}{dt} \in K$ ce coefficient, et
notamment, il y a un sens à écrire $\frac{df}{dt}$ lorsque $f \in K$.
\thingy À titre d'exemple, $\Omega^1_{k(t)/k}$ est le $k(t)$-espace
vectoriel de dimension $1$ et de base le symbole formel $dt$. Pour
toute autre fraction rationnelle $f \in k(t)$, on a bien sûr $df =
f'(t)\,dt$ (en appliquant les règles usuelles de différentiation),
donc $df/dt = f'$ est bien la dérivée au sens usuel d'une fraction
rationnelle.
(Ceci montre au passage que l'hypothèse de séparation n'est pas
anodine dans \ref{differentials-of-separable-field-extension} : en
caractéristique $p>0$, on a $d(t^p) = 0$, et pourtant $t^p$ est bien
une base de transcendance de $k(t)$ sur $k$ — mais ce n'est pas, c'est
là le point à remarquer, une base de transcendance \emph{séparante},
c'est-à-dire que $k(t)$ n'est pas séparable sur $k(t^p)$.)
\danger Il ne faut pas s'imaginer que tous les éléments de
$\Omega^1_{K/k}$ soient des $df$ pour certaines fonctions $f$. Par
exemple, il est bien connu que $\frac{dt}{t} \in \Omega^1_{k(t)/k}$
n'est pas de la forme $df$ (il faudrait prendre $f = \log t$, mais ce
n'est pas une fraction rationnelle).
\thingy La question de savoir quand $dt \neq 0$ est facile en
caractéristique $0$ (si $t$ n'est pas constant, il est transcendant
sur $k$, cf. \ref{constant-functions-on-a-curve}, donc est une base de
transcendance, automatiquement séparante en caractéristique $0$, et
\ref{differentials-of-separable-field-extension} donne $dt\neq 0$) ;
elle l'est moins en caractéristique positive, surtout si $k$ n'est pas
parfait. On va essayer de l'éclaircir :
\begin{prop}\label{differentials-of-valuation-rings-of-a-curve}
Soit $K = k(C)$ est un corps de fonctions de courbe sur $k$, séparable
(cf. \ref{discussion-separability-of-function-fields}), soit $P \in
\mathscr{V}_{K/k}$ une place et soit $R = \mathcal{O}_P$ l'anneau de
valuation correspondant\footnote{Voir
note \ref{footnote-place-versus-valuation}
page \pageref{footnote-place-versus-valuation}.} ($\{f \in K :
\ord_P(f) \geq 0\}$).
Alors le $R$-module $\Omega^1_{R/k}$ s'identifie au sous-$R$-module de
$\Omega^1_{K/k}$ engendré par les $df$ pour $f\in R$ (autrement dit,
$d_R f \mapsto d_K f$ définit une application $R$-linéaire injective,
ce qui permet d'identifier $\Omega^1_{R/k}$ à l'image de celle-ci).
De plus, $\Omega^1_{R/k}$ est \emph{libre} de rang $1$ comme
$R$-module : autrement dit, si on a fixé $t \in R$ une uniformisante
(c'est-à-dire $\ord_P(t) = 1$), il existe $\alpha \in \Omega^1_{R/k}$
tel que tout élément $\omega \in \Omega^1_{K/k}$ s'écrive de façon
unique $\omega = u t^i \alpha$ pour $u \in R^\times$ et $i \in
\mathbb{Z}$, et qu'on ait $i\geq 0$ si et seulement si $\omega \in
\Omega^1_{R/k}$ (cf. \ref{discrete-valuation-rings-are-principal}(b)).
\end{prop}
\begin{proof}[Références]
\cite[théorème II.8.8 et lemme II.8.9]{Hartshorne1977}
\end{proof}
\begin{defn}\label{definition-order-of-a-differential}
Si $K = k(C)$ est un corps de fonctions de courbe sur $k$, séparable
(cf. \ref{discussion-separability-of-function-fields}), alors pour une
place $P$ de $C$ et une différentielle de Kähler $\omega \in
\Omega^1_{K/k}$, on appelle $\ord_P(\omega)$ l'entier $i$ de la
proposition \ref{differentials-of-valuation-rings-of-a-curve},
c'est-à-dire le plus grand $i$ tel qu'on ait $\omega/t^i \in
\Omega^1_{\mathcal{O}_P/k}$ où $t$ est une uniformisante en $P$
(concrètement, il s'agit donc du plus grand $i$ tel qu'on puisse
écrire $\omega = g_1\, df_1 + \cdots + g_N\, df_N$ avec $\ord_P(g_j)
\geq i$ et $\ord_P(f_j) \geq 0$).
Cet entier l'appelle ordre du zéro, ou opposé de l'ordre du pôle,
de $\omega$ en $P$ ; lorsque $\ord_P(\omega)\geq 0$, on dit que
$\omega$ est \defin[holomorphe (différentielle)]{holomorphe} en $P$,
lorsque $\ord_P(\omega) > 0$, on dit qu'elle a un zéro en $P$, lorsque
$\ord_P(\omega) < 0$, on dit qu'elle a un pôle en $P$.
\end{defn}
\thingy Si $\omega \in \Omega^1_{K/k}$ et $g \in K$, il est clair que
$\ord_P(g\omega) = \ord_P(g) + \ord_P(\omega)$ (d'après la même
propriété pour deux fonctions, i.e.,
d'après \ref{valuation-ring-versus-valuation-function}(i)). On notera
aussi que $\ord_P(df) \geq 0$ dès que $\ord_P(f) \geq 0$ (puisque les
$df$ pour $f \in \mathcal{O}_P$ appartiennent
à $\Omega^1_{\mathcal{O}_P/k}$
d'après \ref{differentials-of-valuation-rings-of-a-curve}). Il n'est
pas difficile de se convaincre que $\ord_P$ est la plus petite
fonction qui possède les deux propriétés qu'on vient de signaler.
La définition de $\ord_P(\omega)$ assez complexe. Heureusement, on va
pouvoir la simplifier sous des hypothèses peu contraignantes
(notamment si $k$ est parfait).
\begin{prop}\label{uniformizer-is-separating-transcendance-basis}
Soit $K = k(C)$ est un corps de fonctions de courbe sur $k$, séparable
(cf. \ref{discussion-separability-of-function-fields}), soit $P \in
\mathscr{V}_{K/k}$ une place \emph{elle-même séparable}, c'est-à-dire
que son corps résiduel $\varkappa_P$ est une extension séparable
de $k$, et soit enfin $t$ une uniformisante en $P$
(c'est-à-dire $\ord_P(t) = 1$) : alors $dt$ est une base du $R$-module
$\Omega^1_{R/k}$ (qui est libre de rang $1$ d'après la proposition
précédente) ; en particulier, $dt$ est une base du $K$-espace
vectoriel $\Omega^1_{K/k}$ (ou si on préfère, $t$ est une base de
transcendance séparante de $K$ sur $k$).
\end{prop}
\begin{proof}[Références]
\cite[théorème 2.5.7]{Goldschmidt2003},
\cite[propositions II.1.4 et II.4.3]{Silverman1986}
\end{proof}
\begin{cor}\label{order-of-differential-wrt-uniformizer}
Dans les conditions de la
proposition \ref{uniformizer-is-separating-transcendance-basis}, on a
donc : $\ord_P(\omega) = \ord_P(\omega/dt)$ pour tout $\omega \in
\Omega^1_{K/k}$ (ceci ne dépend pas du choix de l'uniformisante $t$).
\end{cor}
\begin{proof}
On vient de voir
en \ref{uniformizer-is-separating-transcendance-basis} que $dt$ est
une base de $\Omega^1_{R/k}$, c'est-à-dire que $\ord_P(dt) = 0$. On a
alors $\ord_P(\omega) = \ord_P(\omega/dt) + \ord_P(dt)$ comme on l'a
signalé.
\end{proof}
\begin{prop}\label{order-of-derivatives}
Si $K = k(C)$ est un corps de fonctions de courbe sur $k$, séparable
(cf. \ref{discussion-separability-of-function-fields}), et $P \in
\mathscr{V}_{K/k}$ une place elle-même séparable (i.e., $\varkappa_P$
séparable sur $k$) ; alors pour tout $f \in K$ on a :
\begin{itemize}
\item $\ord_P(df) = \ord_P(f)-1$ si $\ord_P(f) \neq 0$ dans $k$ (i.e.,
si $\ord_P(f)$ n'est pas multiple de la caractéristique), et
\item $\ord_P(df) \geq 0$ si $\ord_P(f) \geq 0$.
\end{itemize}
\end{prop}
\begin{proof}
Soit $R := \mathcal{O}_P$ et soit $t$ une uniformisante en $P$ (i.e.,
$\ord_P(t) = 1$).
La seconde propriété citée a déjà été signalée (elle affirme que les
$df$ pour $f \in R$ appartiennent $\Omega^1_{R/k}$). Reste à montrer
la première.
D'après \ref{order-of-differential-wrt-uniformizer}, on sait que
$\ord_P(df) = \ord_P(df/dt)$. Écrivons $f = u t^i$ où $i = \ord_P(f)$
et $u \in R^\times$ (en
utilisant \ref{discrete-valuation-rings-are-principal}). On a alors
$df = i\,u\,t^{i-1}\,dt + t^i\,du$, soit $\frac{df}{dt} =
i\,u\,t^{i-1} + t^i\,\frac{du}{dt}$. Si $i\neq 0$, le premier terme a
valuation exactement $i-1$ et le second a valuation $\geq i$ (car
$du/dt \in R$ comme on vient de le voir au paragraphe précédent), donc
la valuation de la somme est $i-1$ (on
utilise \ref{valuation-ring-versus-valuation-function}(ii.b)).
\end{proof}
\begin{prop}
Si $K = k(C)$ est un corps de fonctions de courbe sur $k$, séparable
(cf. \ref{discussion-separability-of-function-fields}), et soit
$\omega \in \Omega^1_{K/k}$ non nulle. Alors l'ensemble des places
$P$ de $K$ telles que $\ord_P(\omega) \neq 0$ est fini.
\end{prop}
\begin{proof}[Références]
\cite[lemme 2.5.1]{Goldschmidt2003},
\cite[proposition II.4.3(e)]{Silverman1986}
\end{proof}
\begin{defn}
Si $K = k(C)$ est un corps de fonctions de courbe sur $k$, séparable
(cf. \ref{discussion-separability-of-function-fields}), et si $\omega
\in \Omega^1_{K/k}$ est non nulle, on appelle \defin[canonique
(diviseur)]{diviseur canonique} associé à la différentielle $\omega$
le diviseur
\[
\divis(\omega) := \sum_P \ord_P(\omega)\cdot (P)\\
\]
dont le coefficient devant chaque place $P$ est l'ordre de $\omega$ en
cette place (cf. \ref{definition-order-of-a-differential}).
\end{defn}
\thingy\label{canonical-divisor-of-the-projective-line}
À titre d'exemple, calculons $\divis(dt)$ sur $\mathbb{P}^1_k$
où $t$ est l'indéterminée du corps $k(t)$ des fractions rationnelles,
lorsque $k$ est un corps parfait.
En $0$, on a $\ord_0(t) = 1$ donc $\ord_0(dt) = 0$. En $\infty$, on a
$\ord_\infty(t) = -1$ donc $\ord_\infty(dt) = -2$. Reste à traiter le
cas des autres places, pour lesquelles la
proposition \ref{order-of-derivatives} donne \textit{a priori}
seulement $\ord_P(dt) \geq 0$. Mais on a vu que toute telle place a
une uniformisante $h \in k[t]$ (le point essentiel est que $h$ est un
\emph{polynôme} en $t$) : de $\ord_P(h) = 1$ on tire $\ord_P(dh) = 0$,
or $dh = h'\,dt$ (où $h'$ est la dérivée usuelle du polynôme $h$) donc
$0 = \ord_P(dh) = \ord_P(h') + \ord_P(dt)$, et comme $\ord_P(h') \geq
0$ puisque $h' \in k[t]$ et que $\ord_P(dt) \geq 0$, la seule
possibilité est que les deux termes sont nuls, donc en fait
$\ord_P(dt) = 0$ pour chaque place $P$ autre que $\infty$. Bref, on a
montré que $\ord_P(dt) = -2(\infty)$.
\thingy Si $\omega$ et $\omega'$ sont deux différentielles non nulles
sur une même courbe $C$, en appelant $h \in K^\times$ l'unique élément
tel que $\omega' = h\omega$ (vu que $\Omega^1_{K/k}$ est de
dimension $1$), on a $\divis(\omega') = \divis(h) + \divis(\omega)$,
c'est-à-dire que les diviseurs canoniques associés à $\omega$ et
$\omega'$ diffèrent par un diviseur principal, autrement dit, sont
linéairement équivalents
(cf. \ref{definition-linear-equivalence-and-picard-group}).
On peut donc appeler \defin{classe canonique} la
classe\footnote{Normalement la classe canonique est plutôt notée par
la lettre $K$, mais ici nous utilisons systématiquement $K$ pour le
corps des fonctions.} $W \in \Pic(C)$ de n'importe quel diviseur
canonique.
\subsection{Le théorème de Riemann-Roch}\label{subsection-riemann-roch}
\thingy Dans toute cette section, on va à chaque fois supposer la
courbe $C$ \emph{géométriquement} irréductible
(cf. \ref{geometric-irreducibility},
et \ref{function-field-of-an-irreducible-set}). Ceci implique
notamment $\tilde k = k$ (on remplace donc par $1$ toutes les
occurrences de la quantité $[\tilde k : k]$).
\begin{thm}[Riemann-Roch]\label{riemann-roch}
Soit $C$ une courbe géométriquement irréductible sur un corps $k$. Il
existe un entier $g \geq 0$, appelé \defin[genre (d'une
courbe)]{genre} de $C$ tel que pour tout diviseur $D$ on ait, en
notant $W$ un diviseur canonique :
\[
\ell(D) - \ell(W-D) = \deg D + 1 - g
\]
\end{thm}
\begin{proof}[Références]
\cite[corollaire 2.5.11]{Goldschmidt2003},
\cite[théorème II.5.4]{Silverman1986},
\cite[théorème IV.1.3]{Hartshorne1977},
\cite[théorème 3.2.1]{FriedJarden2008}
\end{proof}
\begin{cor}\label{degree-of-canonical-divisor}
\begin{itemize}
\item[(A)] Pour $W$ un diviseur canonique sur une courbe $C$
géométriquement irréductible sur un corps $k$, on a :
\[
\begin{aligned}
\ell(W) &= g\\
\deg(W) &= 2g-2\\
\end{aligned}
\]
\item[(B)] Si $D$ est un diviseur avec $\deg D > 2g-2$, alors $\ell(D) = \deg
D + 1 - g$.
\end{itemize}
\end{cor}
\begin{proof}
Pour la première affirmation, appliquer \ref{riemann-roch} à $D=0$
donne $1-\ell(W) = 0+1-g$, d'où $\ell(W) = g$ ; puis à $D=W$ donne
$g-1 = \deg W + 1 - g$ d'où $\deg W = 2g-2$. Pour la seconde
affirmation, on utilise
\ref{negative-degree-divisors-have-no-sections} pour conclure que
$\ell(W-D) = 0$.
\end{proof}
\thingy S'agissant de la droite projective $\mathbb{P}^1$, il résulte
du calcul fait en \ref{canonical-divisor-of-the-projective-line} que
sa classe canonique est celle de $-2(\infty)$ (on peut tout simplement
dire que c'est $-2$ vu qu'on a vu
en \ref{picard-group-of-the-projective-line} que son groupe de Picard
s'identifie à $\mathbb{Z}$ via le degré des diviseurs). Ce degré $-2$
nous permet de calculer $g_{\mathbb{P}^1}$ par $2g_{\mathbb{P}^1} - 2
= -2$ soit $g_{\mathbb{P}^1} = 0$. Voici une forme de réciproque :
\begin{prop}
Soit $C$ une courbe géométriquement intègre de genre $0$ et ayant une
place rationnelle (cf. \ref{degree-of-a-place}). Alors $C$ est
isomorphe à $\mathbb{P}^1$ (c'est-à-dire que $k(C)$ est $k(t)$ : la
courbe est \emph{rationnelle}).
\end{prop}
\begin{proof}
Soit $P$ une place rationnelle. En
appliquant \ref{degree-of-canonical-divisor}(B) à $(P)$, on trouve
$\ell((P)) = 2$. Il existe donc une fonction $f$ non-constante,
admettant au plus un pôle simple, en $P$ ; comme elle est
non-constante, d'après \ref{constant-functions-on-a-curve}, elle doit
aussi avoir un pôle, donc $\divis(f)$, qui doit être de degré $0$, est
de la forme $(P) - (Q)$.
On applique encore \ref{degree-of-canonical-divisor}(B) au diviseur $D
:= (P)-(Q)$ : il montre que $\ell(D) = 1$.
Mais \ref{negative-degree-divisors-have-no-sections} montre que $D
\sim 0$, c'est-à-dire qu'il existe $f \in k(C)$ tel que $\divis(f) =
(P) - (Q)$. D'après \ref{degree-identity}, on voit que $\deg f
:=[k(C):k(f)] = 1$, c'est-à-dire $k(C) = k(f)$, et comme $f$ est
transcendante parce que non constante, on a bien montré que $k(C)$ est
le corps des fractions rationnelles en une indéterminée.
\end{proof}
\subsection{Points et places}\label{subsection-points-and-places}
\thingy On a défini en \ref{definition-function-field} un « corps de
fonctions de courbe » $K = k(C)$ sur $k$ comme une extension de
corps de $k$ qui soit de type fini et de degré de transcendance $1$
sur $k$. La « courbe » elle-même n'a pas été définie et est
considérée comme un objet purement formel dont on peut parler
essentiellement à travers ses fonctions (i.e., les éléments de $K$) et
ses places (i.e., les valuations — forcément discrètes — non-triviales
de $K$ au-dessus de $k$).
Cependant, si $Z(I)$ est un fermé de Zariski irréductible défini par
un idéal $I$ premier de $k[t_1,\ldots,t_n]$ tel que que le corps des
fractions $K$ de l'anneau $A := k[t_1,\ldots,t_n]/I$ (des fonctions
régulières sur $Z(I)$) soit de degré de transcendance $1$ sur $k$
(\emph{par exemple} $I = (h) \subseteq k[x,y]$ avec $h$ irréductible
comme en \ref{function-field-of-a-plane-curve}), on a envie de faire
un lien entre les « points » (rationnels, fermés ou géométriques)
de $Z(I)$
(cf. \ref{rational-and-closed-points-of-zariski-closed-sets}) et les
places de la courbe $C$ définie par $K$. Un tel rapport existe, même
s'il n'est pas parfait.
\thingy Cherchons dans un premier temps à associer un point
(rationnel, fermé ou géométrique) de $Z(I)$ à une place de $C$. Il
faudra faire une hypothèse (ci-dessous) assurant que la place n'est
pas « à l'infini » par rapport aux coordonnées $t_1,\ldots,t_n$
choisies.
On peut considérer les classes de $t_1,\ldots,t_n$ modulo $I$ comme
des fonctions régulières
(cf. \ref{regular-functions-on-a-zariski-closed-set}) sur $Z(I)$, donc
des éléments de $K = \Frac(A)$, i.e., des fonctions « sur $C$ », qu'on
notera $\bar t_1,\ldots,\bar t_n$. Précisément, si $P$ est une place
de $C$ (c'est-à-dire de $K$), on peut considérer l'évaluation en $P$
de $\bar t_i$ (cf. \ref{evaluation-of-a-function-at-a-place}),
c'est-à-dire soit la classe de $\bar t_i \in \mathcal{O}_P$ modulo
$\mathfrak{m}_P$, si $\ord_P(\bar t_i) \geq 0$, soit le
symbole $\infty$.
Faisons l'hypothèse qu'aucun des $\bar t_i$ n'a de pôle en $P$, ce qui
peut se traduire par $\ord_P(\bar t_i) \geq 0$ pour chaque $i$, ou
encore $A \subseteq \mathcal{O}_P$ (vu que $A$ est le sous-anneau
$k[\bar t_1,\ldots,\bar t_n]$ de $K$ engendré par $k$ et les $\bar
t_i$). Nous résumerons cette hypothèse en « $P$ n'est pas à l'infini
pour les $t_i$ ».
Expliquons d'abord comment on peut obtenir des points
\emph{géométriques} de $Z(I)$ (c'est-à-dire des points dans la clôture
algébrique $k^{\alg}$). Pour cela, plongeons $\varkappa_P$ (qui est
algébrique sur $k$, cf. \ref{degree-of-a-place}) dans $k^{\alg}$. Les
évaluations en $P$ des $\bar t_i$, vues comme des éléments
de $k^{\alg}$, définissent un point dans $(k^{\alg})^n$ : ce point est
solution des équations $h_j$ définissant $I$ (disons $I =
(h_1,\ldots,h_m)$) car $h_j(\bar t_1,\ldots,\bar t_n) = 0$ pour
chaque $j$, ce qui donne la même propriété sur leurs classes
modulo $\mathfrak{m}_P$. On a donc associé à chaque place $P$ de $C$
telle que $A \subseteq \mathcal{O}_P$ un point géométrique de $Z(I)$,
mais il faut souligner que le point en question dépend du plongement
de $\varkappa_P$ dans $k^{\alg}$. (Pour mieux faire les choses, il
faudrait considérer tous les différents plongements de $\varkappa_P$
dans $k^{\alg}$, ce qui, si $k$ est parfait, peut être décrit comme
une orbite sous Galois : on associe donc à la place $P$ une orbite
sous Galois de points géométriques de $Z(I)$.)
Expliquons maintenant comment on peut obtenir un point \emph{fermé}
de $Z(I)$ (c'est-à-dire par définition un $Z(\mathfrak{n})$ avec
$\mathfrak{n}$ idéal maximal de $k[t_1,\ldots,t_n]$ contenant $I$),
toujours sous l'hypothèse que $P$ n'est pas à l'infini pour les $t_i$,
c'est-à-dire $A \subseteq \mathcal{O}_P$. L'intersection
$\mathfrak{p} := A \cap \mathfrak{m}_P$ de $A$ avec l'idéal maximal
$\mathfrak{m}_P = \{x \in K : \ord_P(x) > 0\}$ est encore un idéal
\emph{maximal} : le fait qu'il s'agisse d'un idéal est clair
(l'intersection d'un idéal de $\mathcal{O}_P$ avec un sous-anneau de
celui-ci est certainement un idéal), et il est maximal car l'image $A
/ \mathfrak{p}$ de $A$ dans $\varkappa_P =
\mathcal{O}_P/\mathfrak{m}_P$ est un sous-anneau de $\varkappa_P$
contenant $k$, c'est-à-dire une $k$-algèbre de dimension finie
intègre, donc un corps
d'après \ref{finite-integral-algebra-is-a-field}. L'idéal
$\hat{\mathfrak{p}} := I + \mathfrak{p}$ de $k[t_1,\ldots,t_n]$ (abus
de notation pour les polynômes dont la classe modulo $I$ tombe
dans $\mathfrak{p}$) a le même quotient et il est donc lui aussi
maximal. Autrement dit, ceci définit ce qu'on a appelé un « point
fermé » $Z(\hat{\mathfrak{p}})$ de $Z(I)$. Comme on l'a prouvé au
passage, le corps résiduel $k[t_1,\ldots,t_n]/\hat{\mathfrak{p}}$ de
ce point fermé est inclus dans le corps résiduel $\varkappa_P =
\mathcal{O}_P/\mathfrak{m}_P$ de la place $P$.
Enfin, si dans la situation du paragraphe précédent, $P$ est une place
rationnelle, i.e., $\varkappa_P = k$, alors $A/\mathfrak{p}$ est aussi
égal à $k$, c'est-à-dire que $\hat{\mathfrak{p}}$ est un idéal de la
forme $(t_1-x_1,\ldots,t_n-x_n)$ (où $x_i \in k$ est la classe
de $t_i$ modulo $I+\mathfrak{p}$, c'est-à-dire celle de $\bar t_i$
modulo $\mathfrak{p}$ ou de façon équivalente de
modulo $\mathfrak{m}_P$, i.e., l'évaluation de $\bar t_i$ en $P$). On
obtient donc bien (le singleton d')un point rationnel de $Z(I)$ dans
cette situation, qui coïncide avec le point géométrique construit à
l'avant-dernier paragraphe. (C'est notamment le cas si $k$ est
algébriquement clos ; et si $k$ est parfait, on voit donc que le point
fermé défini au paragraphe précédent est l'orbite sous Galois des
points géométriques définis à l'avant-dernier paragraphe.)
Bref, on a prouvé :
\begin{prop}
Soit $I$ un idéal premier de $k[t_1,\ldots,t_n]$ tel que le corps des
fonctions rationnelles $K := \Frac(k[t_1,\ldots,t_n]/I)$ du fermé de
Zariski $Z(I)$ soit de degré de transcendance $1$ sur $k$, et donc
définisse une courbe $C$ sur $k$. Alors à toute place $P$ de $C$ qui
soit « n'est pas à l'infini pour les $t_i$ » au sens où aucun des
$t_i$ n'a de pôle en cette place on peut associer un point fermé
de $Z(I)$ par évaluation des $\bar t_i$ en $P$ ; et si la place $P$
est rationnelle, le point fermé est lui aussi rationnel.
Notamment, si $k$ est algébriquement clos, les places de $C$ qui ne
sont pas à l'infini pour les $t_i$ définissent des points
(rationnels=géométriques) de $Z(I)$ par évaluation des $\bar t_i$.
\end{prop}
\thingy Il ne faut pas s'attendre à ce que la correspondance entre
places de $C$ non situées à l'infini et points de $Z(I)$ définie aux
paragraphes précédents soit bijective : dans l'exemple de la cubique
nodale décrite en \ref{examples-of-singular-rational-curves}, la
courbe est rationnelle, c'est-à-dire que c'est $\mathbb{P}^1$, et les
deux places $\pm 1$ de $\mathbb{P}^1$ correspondent au seul point
$(0,0)$ de $Z(I)$.
Néanmoins, elle est \emph{surjective} : c'est le contenu du
théorème \ref{existence-of-valuations} qui affirme que pour tout idéal
maximal $\mathfrak{p}$ de $A = k[t_1,\ldots,t_n]/I$ il existe une
valuation $v$ sur $K = \Frac(A)$ telle que $A \subseteq \mathcal{O}_v$
et que $A \cap \mathfrak{m}_v = \mathfrak{p}$. (Notons que $v$ est
forcément non-triviale puisque $\mathfrak{p} \neq 0$ puisque $A$ n'est
pas un corps : car s'il l'était on aurait $K = A$ et
d'après \ref{zariski-lemma} il serait une extension finie de $k$, ce
qui contredit l'hypothèse $\degtrans_k K = 1$.)
\thingy Il existe cependant des conditions sous lesquelles on peut
dire qu'il y a une unique place de $C$ qui détermine un point
de $Z(I)$.
Pour donner un exemple simple mais important, considérons $h \in
k[x,y]$ irréductible tel que $h(0,0) = 0$ et que $h'_y(0,0) \neq 0$ en
notant $h'_y$ la dérivée de $h$ par rapport à sa seconde variable ;
quitte à faire un changement de variable linéaire sur $x$ et $y$, on
peut supposer $h'_x(0,0) = 0$ : c'est-à-dire que $h$ est la somme de
$cy$ par des termes de degré total au moins $2$. Soit $K := k(\bar
x,\bar y:h=0) = \Frac(k[x,y]/(h))$ (on note $\bar x,\bar y$ les
classes de $x,y$ dans $K$ pour les distinguer des indéterminées
elles-mêmes). Si on cherche une valuation $v$ de qui détermine le
point $(0,0)$, c'est-à-dire l'idéal $\mathfrak{p}$ engendré par $\bar
x$ et $\bar y$, elle doit vérifier $a := v(\bar x) > 0$ et $b :=
v(\bar y) > 0$ ; et la donnée de $a$ et $b$ détermine complètement la
valuation des monômes en $\bar x$ et $\bar y$, donc des polynômes, et
finalement de tout élément de $K$. Soit $e$ l'exposant de la plus
petite puissance de $x$ seul qui apparaît dans $h$ (i.e., la valuation
en $0$ de $h(x,0)$) : tout monôme dans $h$ est alors multiple soit de
$y$ (plus petite puissance de $y$) soit de $x^e$ (plus petite
puissance de $x$), donc (modulo $h$) il a une valuation au moins égale
à $b$ ou à $ae$ ; comme $\bar h$ s'annule dans $K$,
\ref{remark-on-sums-in-valuation-rings} montre que $b = ae$. Ainsi,
la valuation de tout polynôme, donc de tout élément de $K$, est
multiple de $a$, et comme la valuation doit être surjective, on a
$a=1$ et du coup $b=e$. La valuation est donc complètement déterminée
par la situation, et comme on sait déjà qu'elle doit exister, on a
montré un cas particulier du résultat suivant :
\begin{prop}
Si $h \in k[x,y]$ est un polynôme irréductible tel que $h'_x$ et
$h'_y$ ne soient pas tous deux nuls en un certain point fermé de
$Z(h)$ (la valeur d'un polynôme en un point fermé $Z(\mathfrak{m})$
doit se comprendre comme la classe de ce polynôme
modulo $\mathfrak{m}$, vue comme un élément du corps résiduel
$k[x,y]/\mathfrak{m}$ du point fermé ; on dit qu'un tel point n'est
pas \defin[singulier (point)]{singulier}, ou qu'il est \defin[régulier
(point)]{régulier}). Alors ce point fermé correspond à une
\emph{unique} place de la courbe de corps des fractions $k(x,y : h=0)
= \Frac(k[x,y]/(h))$, et ils ont même corps résiduel.
Notamment, tout point rationnel de $Z(h)$ en lequel $h'_x$ et $h'_y$
ne s'annulent pas simultanément correspond à une unique place de la
courbe.
\end{prop}
\begin{proof}[Démonstration omise]\end{proof}
\subsection{Revêtements de courbes}\label{subsection-coverings}
\thingy Soit $K = k(C)$ est un corps de fonctions de courbe sur $k$, et
$K \subseteq L$ une extension \emph{finie}. Alors $L$ est lui-même un
corps de fonctions de courbe sur $k$ (le degré de transcendance sur $k$
est toujours $1$ car $K \subseteq L$ est algébrique ; et $L$ est de
type fini sur $k$ car de type fini sur $K$ qui est lui-même de type
fini sur $k$). Appelons $C'$ la courbe correspondante. On dit dans
ces conditions qu'on a affaire à un \defin[revêtement de
courbes]{revêtement} de courbes sur $k$, noté symboliquement
$C'\to C$ (on va voir prochainement comment associer une place de $C$
à une place de $C'$). Le \defin[degré (d'un revêtement)]{degré}
du revêtement est défini comme le degré $[L:K]$ de l'extension.
Plus exactement, un revêtement $\varphi\colon C' \to C$ de courbes est
défini comme un morphisme $\varphi^*\colon k(C) \to k(C')$ d'anneaux,
c'est-à-dire un plongement du corps $k(C)$ des fonctions de $C$ dans
le corps $k(C')$ des fonctions de $C'$ (on note $\varphi^*$ le
morphisme d'anneaux pour le distinguer du revêtement lui-même), qui
fait de $k(C')$ une extension \emph{finie} de $k(C)$. Le degré du
revêtement est $\deg\varphi = [k(C') : k(C)]$.
Par exemple, n'importe quel élément non constant $x \in K$ définit un
revêtement $C \to \mathbb{P}^1$ donné par l'extension $k(x) \subseteq
K$ (qui est finie car algébrique de type fini), qu'on aura tendance à
identifier à $x$, et dont le degré a déjà été noté $\deg(x)$
(cf. \ref{degree-of-a-function}).
\thingy Si $\varphi\colon C'\to C$ est un revêtement de courbes
sur $k$, et si $w$ est une place de $C'$ (c'est-à-dire une valuation
non-triviale sur $L := k(C')$), on peut considérer la restriction
$w|_K = w\circ\varphi^*$ de $w$ à $K := k(C)$. Il est évident qu'elle
satisfait les conditions (o), (i) et (ii)
de \ref{valuation-ring-versus-valuation-function} (puisqu'elle les
satisfait déjà sur $L$) : elle définit donc une valuation sur $K$,
mais on prendra garde au fait que cette valuation n'est pas forcément
surjective — on pourrait même imaginer \textit{a priori} qu'elle soit
triviale.
En fait, $w|_K$ n'est pas triviale, car si $y \in L$ est tel que $w(y)
= -1$, en considérant l'équation minimale $y^n + c_1 y^{n-1} + \cdots
+ c_n = 0$ de $y$ sur $K$, avec $c_i \in K$, il n'est pas possible
d'avoir $w(c_i) = 0$ pour chaque $i$ sinon la somme ne s'annulerait
pas (puisque la valuation du terme $y^n$ serait strictement inférieure
aux autres, cf. \ref{remark-on-sums-in-valuation-rings}).
Le groupe des valeurs $w(K^\times)$ est donc un sous-groupe non
trivial de $w(L^\times) = \mathbb{Z}$, qu'on peut noter $e\mathbb{Z}$,
où $e \geq 1$ est la plus petite valeur strictement positive possible
de $w$ sur un élément de $K$. On définit alors une valuation discrète
$v$ sur $C$ par $v(x) = \frac{1}{e}\,w(x)$ (de manière à ce que $v$
prenne les valeurs $\mathbb{Z}\cup\{\infty\}$ et pas seulement les
multiples de $e$). Cette place $v$ est appelée l'\defin[image d'une
place par un revêtement]{image} de $w$ par le revêtement $\varphi$,
et notée $\varphi(w)$. L'entier $e$ est, pour sa part, appelé
l'\defin{indice de ramification} de $\varphi$ en la place $w$.
Enfin, le degré $[\varkappa_w : \varkappa_v]$ de l'extension des corps
résiduels (définie par le fait que pour $x\in K$ on a $v(x) \geq 0$
ssi $w(x) \geq 0$ et $v(x) > 0$ ssi $v(x) > 0$, si bien que tout
élément de $\varkappa_v = \{x \in K : v(x)\geq 0\} / \{x \in K :
v(x)>0\}$ peut se voir comme un élément de $\varkappa_w = \{x \in L :
w(x)\geq 0\} / \{x \in L : w(x)>0\}$) est appelé le \defin{degré
résiduel} de $\varphi$ en la place $w$.
\thingy\label{summary-ramification-index-and-residual-degree}
On retiendra la définition de l'indice de ramification sous la
forme suivante : si $\varphi\colon C'\to C$ est un revêtement de
courbes, alors pour tout $f \in k(C)$ et toute place $Q$ de $C'$, on a
\[
\ord_Q(\varphi^*(f)) = e_{\varphi,Q}\,\ord_{\varphi(Q)}(f)
\]
où $\varphi(Q)$ est la place image de $Q$ par $f$ et où
$e_{\varphi,Q}$ est l'indice de ramification de $\varphi$ en $Q$
(défini par cette égalité).
Quant au degré résiduel, on peut utiliser la composition des degrés
$\deg(Q) = [\varkappa_{Q} : k] = [\varkappa_{Q} : \varkappa_P] \cdot
[\varkappa_P : k] = f \deg(P)$ (avec $P := \varphi(Q)$) pour
l'exprimer dans la formule analogue
\[
\deg(Q) = f_{\varphi,Q}\,\deg(\varphi(Q))
\]
Par ailleurs, il est utile de noter que si $x \in k(C)$ est non
constant, en se rappelant qu'on a noté $\deg(x) := [k(C) : k(x)]$, on
a $[k(C') : k(x)] = [k(C') : k(C)] \cdot [k(C) : k(x)]$, c'est-à-dire
\[
\deg(\varphi^*(x)) = \deg(\varphi)\,\deg(x)
\]
\begin{prop}
Soit $K = k(C)$ un corps de fonctions de courbe sur $k$, et $f \in K$
un élément non constant identifié au revêtement $C \to \mathbb{P}^1_k$
donné par l'extension $k(f) \subseteq K$. Alors pour toute place $P$
de $C$, la place image $f(P)$ de $\mathbb{P}^1$ définie ci-dessus (par
restriction de $w := \ord_P$ à $k(f)$) coïncide bien avec ce qu'on a
appelé évaluation de $f$ en $P$
en \ref{evaluation-of-a-function-at-a-place} (quitte à identifier un
élément de $\varkappa_P$ à la place de $\mathbb{P}^1$ définie par son
polynôme minimal sur $k$, cf. \ref{places-of-the-projective-line}).
De plus, l'indice de ramification de $f$ en $P$ vaut :
\begin{itemize}
\item l'ordre $\ord_P(f)$ du zéro de $f$ en $P$ si $f(P) = 0$ (i.e.,
$\ord_P(f) > 0$),
\item l'ordre $-\ord_P(f)$ du pole de $f$ en $P$ si $f(P) = \infty$
(i.e., $\ord_P(f) < 0$).
\end{itemize}
\end{prop}
\begin{proof}
Soit $w = \ord_P$ la valuation correspondant à la place $P$. Pour $g$
une fraction rationnelle en une indéterminée $t$, on considère
$w|_{k(t)}(g) = \ord_P(g\circ f)$ (on identifie $k(t)$ à $k(f)
\subseteq K$ par la composition à droite par $f$ puisque $f$ est
transcendant, cf. \ref{monogeneous-extensions-dichotomy}) : le but est
de comprendre la valuation ainsi définie (après division par un entier
à déterminer).
Tout d'abord, dans le cas où $\ord_P(f) < 0$, on a $\ord_P(g\circ f) =
\deg(g)\,\ord_P(f)$ si $g \in k[t]$ comme on le calcule facilement en
écrivant explicitement $g$ et en utilisant
\ref{valuation-ring-versus-valuation-function} (i) et (ii.b), et par
conséquent (cf. \ref{valuations-on-integral-domains}), on a
$w|_{k(t)}(g) = -v_\infty(g)\,\ord_P(f)$ quel que soit $g\in k(t)$.
Ceci montre bien que la place image est $\infty$ et que l'indice de
ramification est $-\ord_P(f)$.
Le cas où $\ord_P(f) > 0$ s'en déduit par composition de $g$
par $\frac{1}{t}$ (avant de composer par $f$) : dans ce cas, on a
$w|_{k(t)}(g) = v_0(g)\,\ord_P(f)$ quel que soit $g\in k(t)$,
c'est-à-dire que la place image est $0$ et que l'indice de
ramification est $\ord_P(f)$.
Dans le cas où $\ord_P(f) = 0$, soit comme d'habitude $\mathcal{O}_P =
\{x \in K : \ord_P(x) \geq 0\}$ l'anneau de valuation en $P$, et
$\mathfrak{m}_P = \{x \in K : \ord_P(x) > 0\}$ son idéal maximal et
$\varkappa_P = \mathcal{O}_P/\mathfrak{m}_P$ le corps résiduel, et
soit $h \in k[t]$ le polynôme minimal sur $k$ de la classe $\bar f$ de
$f$ modulo $\mathfrak{m}_P$ (i.e., de ce qu'on a appelé évaluation de
$f$ en $P$ en \ref{evaluation-of-a-function-at-a-place}). Le fait que
$h(\bar f) = 0 \in \varkappa_P$ signifie exactement $h\circ f \in
\mathfrak{m}_P$, c'est-à-dire $\ord_P(h\circ f) > 0$, autrement dit
$w|_{k(t)}(h) > 0$. Comme $h$ est unitaire irréductible sur $k$, il y
a (cf. \ref{places-of-the-projective-line}) une unique valuation $v$
sur $k(t)$ au-dessus de $k$ donnant la valeur $1$ à $h$ : on en déduit
que $w|_{k(t)}(g) = e\, v(g)$ où $e = \ord_P(h\circ f)$. et on a bien
montré comme annoncé que la place $v$ image de $w = \ord_P$ par $f$
est celle associée au polynôme minimal $h$ de $\bar f = f(P)$.
\end{proof}
\begin{thm}
Soit $\varphi\colon C'\to C$ un revêtement de courbes sur $k$, soit
$P$ une place quelconque de $C$ et $Q_1,\ldots,Q_n$ les places de $C'$
dont l'image par $\varphi$ est $P$. Notons $e_i$ l'indice ce
ramification de $\varphi$ en $Q_i$ et $f_i = [\varkappa_{Q_i} :
\varkappa_P]$ le degré résiduel. Alors on a
\[
\sum_{i=1}^n e_i\,f_i = \deg(\varphi)
\]
\end{thm}
\begin{proof}
L'idée est de se ramener au théorème \ref{degree-identity} dont
celui-ci est une généralisation.
Soit $x \in K := k(C)$ dont le seul zéro est en la place $P$ : un tel
élément existe car $\ell(n\cdot(P)) > 0$ pour $n$ suffisamment grand
d'après \ref{degree-of-canonical-divisor}(B), si bien qu'il existe une
fonction n'ayant aucun pôle ailleurs qu'en $P$, et en l'inversant on
obtient une fonction n'ayant aucun zéro ailleurs qu'en $P$. Disons
$\ord_P(x) =: r$.
Les zéros de $\varphi^*(x)$ sont exactement les places de $C'$ dont
l'image par $\varphi$ est $P$ (puisque $\ord_Q(\varphi^*(x)) =
e_{\varphi,Q} \, \ord_{\varphi(Q)}(x)$ est strictement positif si et
seulement si $\ord_{\varphi(Q)}(x)$ l'est, ce qui signifie bien que
$x$ a un zéro en $\varphi(Q)$, autrement dit que $\varphi(Q) = P$
puisque $x$ n'a de zéro qu'en $P$).
Le théorème \ref{degree-identity} donne $\sum_{i=1}^n
\ord_{Q_i}(\varphi^*(x))\,\deg(Q_i) = \deg(\varphi^*(x))$. Mais comme
on l'a expliqué
en \ref{summary-ramification-index-and-residual-degree}, on a d'une
part $\ord_{Q_i}(\varphi^*(x)) = e_i r$, d'autre part $\deg(Q_i) = f_i
\deg(P)$, et enfin $\deg(\varphi^*(x)) = \deg(\varphi)\,\deg(x)$.
Bref, $\sum_{i=1}^n e_i f_i r\deg(P) = \deg(\varphi)\,\deg(x)$. Comme
on a aussi $r\deg(P) = \deg(x)$ par une nouvelle application
de \ref{degree-identity}, on en déduit la formule annoncée.
\end{proof}
%
%
%
\begin{thebibliography}{xxx}
\bibitem[Fried \& Jarden 2008]{FriedJarden2008} Michael D. Fried \&
Moshe Jarden, \textit{Field Arithmetic}, Springer (3rd edition
2008), ISBN 978-3-540-77269-9.
\bibitem[Goldschmidt 2003]{Goldschmidt2003} David M. Goldschmidt,
\textit{Algebraic Functions and Projective Curves}, Springer (2003)
Graduate Texts in Mathematics \textbf{215}, ISBN 978-1-4419-2995-2.
\bibitem[Hartshorne 1977]{Hartshorne1977} Robin Hartshorne,
\textit{Algebraic Geometry}, Springer (1977) Graduate Texts in
Mathematics \textbf{52}, ISBN 978-1-4419-2807-8.
\bibitem[Matsumura 1989]{Matsumura1989} Hideyuki Matsumura,
\textit{Commutative Ring Theory}, Cambridge University Press
(paperback edition 1989), ISBN 978-0-521-36764-6.
\bibitem[Silverman 1986]{Silverman1986} Joseph H. Silverman,
\textit{The Arithmetic of Elliptic Curves}, Springer (1986) Graduate
Texts in Mathematics \textbf{106}, ISBN 978-1-4757-1922-2.
\end{thebibliography}
%
%
%
\printindex
%
%
%
\end{document}