http://pancake.uchicago.edu/~carroll/notes/ : J. Fric endosse toute responsabilité pour les erreurs que sa traduction (qui n'a pas été vérifiée par l'auteur) aurait pu ajouter. En cas de doute, veuillez vous rapporter à la version originale.
3. De la courbure des Espaces
(variétés Riemanniennes)....................................................... 4
Introduction.......................................................................................................................... 4
Connexion
métrique............................................................................................................ 4
Dérivée covariante................................................................................................................ 4
Propriétés
fondamentales................................................................................................ 5
Coefficients de connexion.................................................................................................... 5
Propriétés des transformations des dérivées
covariantes de vecteurs................................. 5
Les coefficients de connexion ne sont pas des
tenseurs...................................................... 6
Dérivée covariante d'un tenseur........................................................................................... 6
Propriétés complémentaires............................................................................................. 7
Connexion en Relativité Générale....................................................................................... 9
Le tenseur de torsion............................................................................................................ 9
Hypothèses complémentaires pour la connexion
métrique........................................... 10
Unicité de la connexion métrique: Sa valeur en
fonction de la métrique......................... 10
Connexion de Christoffel (connexion métrique)............................................................... 11
Symboles de Christoffel................................................................................................. 11
Exemple de calcul des symboles de Christoffel............................................................ 12
Divergence d'un vecteur................................................................................................. 13
Faisons le point................................................................................................................... 14
Transport parallèle............................................................................................................. 15
Transport parallèle d'un vecteur..................................................................................... 15
Le résultat d'un transport parallèle dépend du
chemin suivi............................................. 17
De la difficulté de définir une vitesse relative
d'objets éloignés.................................. 17
Définition d'une méthode de transport parallèle........................................................... 18
Equation du transport parallèle.......................................................................................... 19
Le transport parallèle conserve le produit
scalaire de vecteurs.................................... 19
Propagateur parallèle.......................................................................................................... 20
Holonomie d'une boucle................................................................................................. 22
L'équation géodésique........................................................................................................ 22
L'équation géodésique définie par le vecteur
tangent....................................................... 23
L'équation géodésique définie comme extremum du
chemin........................................... 23
Expression du symbole de Christoffel en fonction
du tenseur métrique.......................... 25
Equation géodésique en présence de forces................................................................... 26
Paramètres affines.......................................................................................................... 26
Conservation type d'intervalle d'espace-temps sur
une géodésique.............................. 28
"Justification" que l'extremum est un maximum.......................................................... 29
De la possible multiplicité des géodésiques.................................................................. 29
Utilisation des géodésiques pour baliser un
voisinage : la carte exponentielle............ 30
Géodésiques incomplètes............................................................................................... 31
Théorèmes de singularités.............................................................................................. 33
Le tenseur de courbure de Riemann................................................................................... 33
Forme générale à priori du tenseur de Riemann............................................................ 34
Commutateur de dérivées covariantes............................................................................... 35
Dans un espace où les composantes du tenseur
métrique sont constantes, le tenseur de Riemann est nul et réciproquement................................................................................... 38
Les (anti)symétries du tenseur de Riemann....................................................................... 39
En quatre dimensions, le tenseur de Riemann a 20
composantes indépendantes......... 42
L'identité de Bianchi.......................................................................................................... 42
Le tenseur de Ricci............................................................................................................. 43
Le scalaire de Ricci............................................................................................................ 43
Le tenseur d'Einstein.......................................................................................................... 43
Le tenseur de Weyl............................................................................................................. 44
Le tenseur de Weyl est invariant par une
transformation conforme............................. 45
Courbure intrinsèque, courbure extrinsèque...................................................................... 45
Quelques exemples trompeurs (cylindre, tore).............................................................. 45
Le cas du cône................................................................................................................ 46
Courbures positives, négatives....................................................................................... 48
La déviation géodésique..................................................................................................... 49
L'équation de déviation géodésique................................................................................... 51
Connexions non métriques................................................................................................. 51
Base orthonormée, de vecteurs, non dérivée des
fonctions de coordonnées................. 51
Tétrades, Vielbeins............................................................................................................. 52
Transformations locales de Lorentz ( LLT),
Transformations générales de coordonnées (GCT).............................................................................................................................. 55
Connexion de spin.............................................................................................................. 55
Equations de structure de Maurer-Cartan......................................................................... 58
Dérivée extérieure covariante........................................................................................ 59
Comparaison des connexions et de la courbure en
géométrie de Riemann avec celle des théories de jauge en physique des
particules..................................................................... 60
Transformations de jauge, théories de jauge..................................................................... 61
Dérivée covariante de jauge........................................................................................... 61
Des différences subsistent.............................................................................................. 62
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN"><!-- saved from url=(0068)http://nedwww.ipac.caltech.edu/level5/March01/Carroll3/Carroll3.html -->
De
notre étude sur les variétés, il ressort que dès qu'une variété est définie,
nous pouvions immédiatement y définir des fonctions, prendre leurs dérivées,
considérer des courbes paramétrées, et y construire des tenseurs entre autres.
D'autres concepts comme le volume d'une région, la longueur d'un arc de courbe
ont nécessité l'introduction d'une structure fondamentale complémentaire, à
savoir : La métrique.
Il
vient naturellement à l'esprit, que la courbure d'un espace, concept que nous
avons déjà évoqué, dépend de la métrique. En fait, ceci n'est pas suffisamment
précis, ou du moins est incomplet.
En
fait la structure nécessaire que nous devons introduire est la connexion (métrique) qui est
caractéristique de la courbure. Nous montrerons comment l'existence d'une
métrique implique une certaine connexion (métrique), dont la courbure reflète
celle de la métrique.
Cette
connexion se révèle nécessaire quand nous voulons remédier au caractère non
tensoriel de la dérivée partielle. Nous avons besoin d'une dérivée covariante,
opérateur qui se réduit à la dérivée partielle dans les espaces plats, en
coordonnées cartésiennes, mais qui respecte la loi de transformation
tensorielle dans une variété quelconque. La tradition veut qu'on justifie
longuement cette introduction, alors qu'en fait le besoin est évident.
Des
équations telles que¶mTmn = 0 doivent être généralisées à des espaces courbes
d'une certaine manière. Donc nous ne pouvons pas nier que disposer d'une
dérivée covariante serait une bonne chose, et regardons comment nous y prendre.
L'opérateur
de dérivée partielle ¶m, dans les espaces plats en coordonnées cartésienne
est une application linéaire d'un champ
de tenseur (k, l ) vers un autre champ de
tenseur (k, l + 1). Il agit linéairement sur les arguments du tenseur et obéit
à la règle de Leibniz pour les produits de tenseurs. Tout ceci continue à être
vrai dans une situation plus générale, mais le résultat de l'application
linéaire dépend du système de
coordonnées utilisé.
Nous
voudrions définir un opérateur de dérivée
covariante
qui
réaliserait l'opération de dérivée partielle, mais de façon indépendante des
coordonnées.
Nous
exigerons donc de
qu'il
soit une application linéaire de tenseurs (k,
l) vers des tenseurs (k, l
+ 1) avec les deux propriétés suivantes:
$\nabla(T+S) = \nabla T + \nabla S$
-->
(T + S)
=
T +
S ;
Si
obéit à la règle de Leibniz il peut toujours être
écrit comme une dérivée partielle plus une transformation linéaire. Pour
prendre la dérivée covariante, nous commençons par prendre la dérivée partielle
et nous appliquons une correction pour rendre le résultat covariant (nous
n'allons pas en faire la preuve, mais vous la trouverez dans "Wald"
si cela vous intéresse). Considérons le cas d'un vecteur Vn. Cela signifie que pour chaque direction m, la dérivée covariante Ñm va
consister en la dérivée partielle ¶m plus une correction spécifiée par une matrice (Gm)rs. (Une matrice n × n,
où n est la dimension de la variété
pour chaque index m).
En
fait les parenthèses sont généralement omises et nous écrirons ces matrices
appelées coefficients de connexion,
de la manière suivante : Grms. Nous avons donc
|
<TBODY> |
(3.1) </TBODY> |
Remarquons
que dans le second membre, l'index original du vecteur V a été transféré vers
, et le nouvel index ne sert qu'à la sommation. Si c'est bien l'expression de
la dérivée covariante d'un vecteur en termes de dérivée partielle, nous
devrions être capables de déterminer les propriétés de transformation de Gnml, en exigeant que le membre de gauche soit un tenseur
(1,1).
Donc,
nous voulons que la loi de transformation soit :
|
<TBODY> |
(3.2) </TBODY> |
Commençons
par le membre de gauche, on peut le développer en utilisant (3.1) et ensuite
transformer les parties par les règles que nous connaissons :
|
<TBODY> |
(3.3) </TBODY> |
Le membre de droite peut être
développé de façon similaire :
|
<TBODY> |
(3.4) </TBODY> |
Ces
deux expressions doivent être égalées, le premier terme de chaque est identique
et s'annule donc, alors nous avons :
|
<TBODY> |
(3.5) </TBODY> |
Où
nous avons renommé l'index de sommation
en
. Cette équation doit être vraie pour tout vecteur Vl, donc nous pouvons l'éliminer des deux membres.
Ensuite les coefficients de connexion dans les coordonnées "primées"
peuvent être isolées en multipliant par
xl/
xl'.
Le
résultat est :
|
<TBODY> |
(3.6) </TBODY> |
Ce
n'est évidemment pas une loi de transformation de tenseur, à cause du second
terme.
Ceci
est normal puisque les coefficients de
connexion ne sont pas des tenseurs. Par construction, les
's
sont non tensoriels puisqu'ils sont destinés à "corriger" et rendre
tensoriels les dérivées partielles qui ne le sont pas, autrement dit annuler le
terme qui détruit le caractère tensoriel (donc qui n'est pas un tenseur!) de
l'expression (3,1).
C'est
pourquoi il faut être attentif au placement des index dans les coefficients de
connexion, ils ne sont pas des tenseurs et nous ne pouvons pas les abaisser ou
les élever à l'envi.
Penchons-nous
maintenant sur le cas des dérivées
covariantes des autres types de tenseurs. Par un raisonnement similaire à celui
que nous avons utilisé pour les vecteurs, on montre que la dérivée covariante
de formes mono-linéaires est égale à leur dérivée partielle corrigée par une
transformation linéaire. A priori, il n'y a pas de raison que ce soit les même
matrices à base des mêmes coefficients G nml qui
expriment cette transformation. En général nous pouvons écrire :
|
<TBODY> |
(3.7) </TBODY> |
où
nml
est un nouvel ensemble de matrices pour chaque indice m.
(Attention au placement et à l'utilisation des index). Il est immédiat de
montrer que les propriétés de transformation de
doivent être les mêmes que
,
mais à part cela nous n'avons pas d'autres relations.
Pour
ce faire nous devons introduire deux nouvelles propriétés supplémentaires que
nous voudrions que les dérivées covariantes satisfassent :
-commutatif vis à vis des contractions: Ñm (Tllr)
= (
T)m llr
,
-se ramène à une dérivée partielle pour les scalaires
: Ñmf=
¶mF.
Ces
propriétés ne sont pas dérivées des précédentes, ce sont des exigences
nouvelles que nous formulons pour la définition de la dérivée covariante.
Regardons
ce qu'elles impliquent. Soit un champ de formes mono-linéaires wm
et un champ de vecteurs Vm, nous pouvons prendre la dérivée covariante du
scalaire défini par wl Vl et
obtenir
|
<TBODY> |
(3.8) </TBODY> |
Mais
comme wlVl est
un scalaire ceci doit se ramener à la dérivée partielle :
|
<TBODY> |
(3.9) </TBODY> |
|
|
|
Ceci
n'est possible que si les termes comprenant des coefficients de connexion
s'annulent dans (3.8), donc en renommant les indices de sommation nous avons :
|
<TBODY> |
(3.10) </TBODY> |
Mais comme ws et
Vl sont arbitraires alors :
|
<TBODY> |
(3.11) </TBODY> |
Les
deux conditions complémentaires nous ont donc permis d'exprimer la dérivée
covariante d'une forme mono-linéaire en utilisant les mêmes coefficients de
connexion que ceux utilisés pour les vecteurs (mais en inversant le signe et
reliant les index différemment ) :
|
<TBODY> |
(3.12) </TBODY> |
Ayons
montré que c'était vrai pour les deux types fondamentaux de tenseurs, et compte
tenu de la linéarité des opérateurs tensoriels, nous n'allons pas être surpris
que les coefficients de connexion contiennent toute l'information nécessaire
pour prendre la dérivée covariante de n'importe quel type de tenseur. La
formule est biblique, pour chaque index haut, nous devons introduire un terme
correctif +
, à la dérivée partielle et un terme correctif -
pour chaque index bas.
|
<TBODY> |
(3.13) </TBODY> |
C'est
l'expression générale de la dérivée covariante. Vous pouvez vérifier qu'elle
est déduite du jeu d'axiomes que nous avons posé, et des exigences habituelles
relatives à l'indépendance du caractère tensoriel vis à vis des coordonnées.
Citons une variante de notation utilisant les virgules pour les dérivées
partielles et les point-virgules pour les dérivées partielles covariantes.
|
<TBODY> |
(3.14) </TBODY> |
De nouveau, je rappelle que
je ne suis pas adepte de cette notation.
Pour
définir la dérivée covariante, nous devons donc munir notre variété d'une
"connexion" qui est spécifié dans un système de coordonnées par
l'ensemble de ses coefficients Glmn
(n3 = 64 composantes
indépendantes pour n = 4 dimensions)
qui se transforme selon (3.6).
Le
nom "connexion" vient du fait qu'elle est utilisée pour transporter
des vecteurs d'un espace tangent vers un autre comme nous verrons plus loin.
Nous
pouvons définir un grand nombre de connexions dans une variété, chacune
associée à une notion différente de dérivée covariante.
En
Relativité Générale, cette liberté ne nous gêne pas, car il apparaît qu'à
chaque métrique n'est associée qu'une seule connexion.
Regardons
comment nous y prendre.
La
première chose est de noter que la différence entre deux connexions est un
tenseur (1, 2).
Si
nous avons deux ensembles de coefficients connexion Glmn et ^Glmn,
leur différence : Smnl = Glmn - ^Glmn,
(
remarquons la position des index) se transforme selon :
|
<TBODY> |
(3.15) </TBODY> |
Ce
qui est bien conforme à la loi de transformation des tenseurs, donc Smnl est
bien un tenseur. Ceci implique que tout ensemble de connexions peut s'exprimer
comme la somme d'une connexion irréductible et d'un tenseur quelconque.
Remarquons
également que d'une connexion donnée, Glmn,
on peut immédiatement en former une autre par permutation des index bas.
Ceci
dit, l'ensemble des coefficients Glmnva se transformer selon (3.6) (car les dérivées
partielles présentes dans le dernier terme peuvent être commutées) et ainsi
définir une connexion différente.
Nous
pouvons ainsi associer un tenseur à chaque connexion, appelé le tenseur de torsion, défini par :
|
<TBODY> |
(3.16) </TBODY> |
Il
est clair que ce tenseur est antisymétrique dans ses indices.
Une
connexion qui est symétrique dans ses indices est dite sans torsion.
Définissons
une connexion unique dans une variété munie d'une métrique gmn
en ajoutant deux propriétés:
Définissons
la compatibilité métrique d'une connexion (que
nous appellerons connexion métrique)
par le fait que la dérivée covariante par rapport à la connexion de la métrique
soit identiquement nulle.
Ceci
implique quelques propriétés sympathiques.
D'abord,
c'est un jeu d'enfant que de montrer que la dérivée covariante de la métrique
inverse est également nulle.
|
<TBODY> |
(3.17) </TBODY> |
Ensuite,
une dérivée covariante compatible avec la métrique est commutative vis à vis de
l'abaissement ou de l'élévation d'index.
Soit
pour un champ de vecteurs Vl,
|
<TBODY> |
(3.18) </TBODY> |
Avec
des connexions non compatibles avec la métrique il faut être très vigilant sur
le placement des index, lorsqu'on exécute une dérivée covariante.
Nous
revendiquons l'unicité de connexion sans torsion pour une variété donnée qui
est compatible avec une métrique donnée de cette variété.
Nous
n'inclurons pas ces deux exigences dans la définition de la dérivée covariante,
elles sélectionnent simplement une possibilité parmi de nombreuses.
Nous
pouvons démontrer et l'existence et l'unicité en dérivant une expression
manifestement unique des coefficients de la connexion en termes de la métrique.
A
cet effet, développons l'équation de compatibilité de la métrique pour les
trois permutations différentes des index.
|
<TBODY> |
|
|
|
|
(3.19) </TBODY> |
||
Nous
soustrayons la deuxième et la troisième de la première et utilisons la symétrie
de la connexion pour obtenir:
|
<TBODY> |
(3.20) </TBODY> |
D'évidence,
en multipliant par gsr
, on résout cette équation. Le résultat est :
|
<TBODY> |
(3.21) </TBODY> |
|
|
|
C'est
une des formules les plus importantes dont on doit se souvenir sur le sujet.
Certes nous n'avons fait que prouver qu'il s'il existe une connexion sans
torsion et compatible avec la métrique elle doit être de la forme (3.21).
Vous
pouvez vérifier que le membre de droite de (3.21) se transforme comme une
connexion. Cette connexion que nous venons de définir à partir de la métrique
est un des piliers de la Relativité générale classique (gardons toutefois une
ouverture d'esprit pour la suite).
Elle
est connue sous différents vocables : Connexion de Christoffel, connexion de Levi-Civita
ou connexion de Riemann.
Les
coefficients de la connexion sont appelés symboles de Christoffel et écrits {smn}
notation que nous éviterons. L'étude des variétés munis d'une métrique avec
leur connexion associée est appelée la
Géométrie Riemannienne.
L'étude
de connexions plus générales a été faite par Cartan, mais nous n'avons pas
évoqué ici la géométrie de Cartan.
Avant
d'utiliser nos dérivées covariantes, dans ce qui suit, mentionnons
quelques-unes de leurs propriétés.
D'abord
rappelons qu'une connexion n'a pas à être construite à partir de la métrique.
Dans
l'espace plat ordinaire, il y a une connexion implicite que nous utilisons tout
le temps, la connexion de Christoffel construite sur une métrique plate.
Mais
nous pouvons si nous le voulons en choisir une différente, tout en conservant
la métrique plate.
Remarquons
également, que dans une métrique plate, les coefficients de la connexion de
Christoffel s'annulent en coordonnées cartésiennes, mais pas en coordonnées
curvilignes.
Considérons
par exemple le plan en coordonnées polaires, muni de la métrique :
|
<TBODY> |
(3.22) </TBODY> |
Les
coefficients non nuls de la métrique inverse sont : grr = 1 et g![]()
= r-2.
(Nous utilisons r et
comme index dans cette notation évidente.)
Nous
pouvons calculer un coefficient de connexion typique :
|
<TBODY> |
|
|
|
|
(3.23) </TBODY> |
Celui-ci s'annule, mais
d'autres non :
|
<TBODY> |
(3.24) </TBODY> |
Continuons sur notre lancée :
|
<TBODY> |
(3.25) </TBODY> |
L'existence
de coefficients de connexions non nuls en coordonnées curvilignes est à la
source des formules pour la divergence, entre autres, que nous trouvons dans
les livres d'électricité et de magnétisme.
A
contrario, même dans un espace courbe on peut annuler ponctuellement les
symboles de Christoffel.
Cela
s'explique par le fait que nous pouvons annuler les dérivées premières
ponctuellement.
Ceci
n'est bien sûr valable qu'au point, pas dans son voisinage.
Une
autre propriété utile est que la formule de la divergence d'un vecteur
(conformément à la connexion de Christoffel) prend une forme très simple. La
divergence covariante de Vm est donnée par :
|
<TBODY> |
(3.26) </TBODY> |
Il
est facile de montrer (voir pp. 106-108 de Weinberg) que la connexion de
Christoffel satisfait
|
<TBODY> |
(3.27) </TBODY> |
Et de là nous obtenons :
|
<TBODY> |
(3.28) </TBODY> |
On
peut exprimer la divergence de tenseurs de rang plus élevé, mais la formule ne
se simplifie pas de cette manière.
Un
dernier point que nous nous devons de rappeler au sujet des connexions est le
fait que la dérivée extérieure est un tenseur parfaitement défini même en
l'absence de toute connexion.
La raison en est que si on utilise une
connexion symétrique (sans torsion), la dérivée extérieure (définie comme
dérivée partielle anti-symétrisée) se révèle être égale à la dérivée covariante
anti-symétrisée :
|
<TBODY> |
(3.29) </TBODY> |
Cela
a conduit quelques esprits chagrins à souligner "l'ambiguïté" de la
dérivée extérieure dans les espaces avec torsion, ou la simplification
ci-dessus ne se produit pas.
Il
n'y a pas d'ambiguïté, la dérivée extérieure se passe de connexion, quelle qu'elle
soit et la torsion n'intervient donc pas dans la dérivée extérieure de quoi que
ce soit.
Avant
de poursuivre notre œuvre plus avant, récapitulons ce que nous avons fait.
Nous
partîmes de la notion de base d'un ensemble, supposée connue (au moins
informellement). Nous avons introduit le concept de sous-ensembles ouverts sur
notre ensemble, ce qui est équivalent à introduire une topologie et par la même
nous avons promu notre ensemble "espace vectoriel".
Ensuite
en exigeant que chaque ensemble ouvert soit assimilable à une région de Rn
(avec n identique pour chaque
ensemble) et aussi que les diagrammes de coordonnées puissent être assemblés
sans raccord, l'espace topologique est devenu une variété.
Une
variété est une structure à la fois très souple et très puissante et se trouve
munie naturellement d'un faisceau tangent, d'un faisceau de tenseurs
quelconques, et de la possibilité de prendre des dérivées extérieures entre
autres.
Nous
avons ensuite défini une métrique sur la variété qui est alors devenue une
variété Riemannienne.
Indépendamment
de la métrique nous avons défini une connexion, nous permettant de prendre des
dérivées covariantes.
Si
nous disposons d'une métrique, nous avons montré qu'il y avait une connexion
unique compatible, sans torsion, avec la métrique.
Rien
ne nous empêche d'ailleurs, de définir d'autres connexions et d'autres
métriques sur la variété.
Nous
avons résumé tout cela sur le diagramme ci-dessous :

![]()
![]()
![]()
![]()
Maintenant
que nous disposons du mécanisme de connexion, intéressons-nous au transport
parallèle.
Rappelons
qu'en espace plat, il n'était pas nécessaire d'être très attentifs au fait que
les vecteurs étaient des éléments d'espaces tangents définis en chaque point.
La
comparaison (y compris les opérations telles que l'addition, soustraction,
produit scalaire, ..) de vecteurs se faisait naturellement en différents points
de l'espace.
La
raison est que dans un espace plat on peut déplacer un vecteur d'un point à un
autre en le gardant constant ce qui permet d'effectuer toutes ces opérations
autorisées dans un espace vectoriel.
Déplacer
un vecteur en le gardant égal à lui-même tout au long du chemin s'appelle un
transport parallèle.
Comme
nous allons le voir, le transport parallèle est défini quand nous avons une
connexion.
La
manipulation intuitive des vecteurs dans un espace plat s'appuie sur une
connexion de Christoffel implicite dans cet espace.
La
différence cruciale entre espace plats et espaces courbes est que dans un
espace courbe, le résultat du transport
parallèle d'un point vers un autre va dépendre du chemin emprunté pour s'y
rendre.
Sans disposer du mécanisme complet du
transport parallèle, utilisons notre connaissance de la sphère (2D) pour
l'illustrer.
Partons
avec un vecteur au niveau de l'équateur pointant vers une ligne de longitude
constante.
Transportons-le
naturellement jusqu'au pôle nord le long de cette ligne de longitude constante.
Repartons
du même point avec le même vecteur et transportons le parallèlement le long de
l'équateur (pointant vers le nord) d'un angle
,
puis transportons le vers le pôle nord comme précédemment.
On
voit clairement sur la figure que le même vecteur transporté par deux chemins
différents au pôle nord arrive avec deux positions différentes faisant un angle
.
Il
apparaît donc qu'il n'y a pas de moyen unique de transporter un vecteur d'un
espace tangent vers un autre, nous pouvons toujours le transporter
parallèlement, mais le résultat dépend du chemin suivi, et il n'y a pas de
choix naturel de chemin à suivre.
A
la différence d'autres problèmes que nous avons rencontrés, celui-là n'a pas de solution, nous
devons admettre que deux vecteurs ne peuvent être comparés naturellement que
s'ils appartiennent au même espace tangent.
Par
exemple deux particules se croisant ont une vitesse relative bien définie
(inférieure à la vitesse de la lumière).
Mais
deux particules en deux points différents d'une variété courbe n'ont pas de
vitesse relative bien définie, cette notion de vitesse relative dans ce cas est
dépourvue de sens.
Certes,
dans certaines situations particulières il peut être utile de faire comme si
cela en avait un, mais gardons à l'esprit que l'utilité ne se substitue pas à
une définition rigoureuse.
En
Cosmologie par exemple, la lumière provenant de Galaxies lointaines, subit un
décalage vers le rouge similaire à celui qui serait produit par le mouvement de
récession d'une source proche. Comme ce phénomène ressemble à celui produit par un effet
Doppler conventionnel dû à une vitesse relative, il est tentant de dire que les
Galaxies lointaines s'éloignent de nous à une vitesse définie par leur décalage
spectral.
D'un
point de vue formel, c'est absurde, c'est ce que Wittgenstein appellerait une
"faute grammaticale ", on ne peut pas dire que les Galaxies
s'éloignent, puisque la notion de leur
vitesse par rapport à nous, n'est pas strictement, mathématiquement fondée.
Ce
qui se passe en fait, c'est que la métrique de l'espace-temps entre nous et les
Galaxies a changé (l'Univers s'est étendu) le long du chemin d'un photon entre
la bas et ici, produisant un accroissement de la longueur d'onde de la lumière.
Un
exemple qui conduit à une explication erronée, est une utilisation naïve de
l'effet Doppler qui appliquée sans discernement, nous indiquerait que certaines
galaxies s'éloigneraient de nous à une vitesse supérieure à la vitesse de la
lumière, en contradiction avec la Relativité. La solution d'un tel paradoxe
repose simplement sur le fait que la notion de vitesse relative n'est pas
définie correctement.
Maintenant
que nous avons vu ce qu'il ne fallait pas faire, regardons ce que nous pouvons
faire.
Le
transport parallèle d'un vecteur est censé être la généralisation dans des
variétés courbes du concept de transport en gardant le vecteur égal à lui-même
autant que se peut, le long d'un chemin. Ceci vaut aussi pour les tenseurs
quelconques.
Soit
une courbe xm (
), dans un espace plat, le déplacement d'un tenseur le
long de cette courbe, en le maintenant constant (déplacement parallèle) est
caractérisé par dT/dl
=
(dxm/dl)(dT/dxm)=
0. Définissons alors la dérivée covariante sur la courbe par l'opérateur :
|
<TBODY> |
(3.30) </TBODY> |
Nous
définirons alors le transport parallèle
du tenseur T sur le chemin xm (
) par le respect tout au long du transport sur le
chemin de la condition,
|
<TBODY> |
(3.31) </TBODY> |
C'est
une équation tensorielle bien définie, car et le vecteur tangent dxm/d
et la dérivée covariante
T sont des tenseurs.
Cette
équation est appelée équation du
transport parallèle. Pour un vecteur elle prend la forme
|
<TBODY> |
(3.32) </TBODY> |
Nous
pouvons considérer l'équation de transport parallèle comme une équation
différentielle du premier ordre définissant un problème de valeur initiale.
Etant
donné un tenseur en un point d'une courbe, il n'y a qu'une seule possibilité de
déplacer le tenseur le long de la courbe de telle façon que (3.31) soit
satisfait. Nous dirons que nous effectuons un transport parallèle du tenseur.
La
notion de transport parallèle dépend manifestement de la connexion, et
différentes connexions conduisent à différentes solutions. Si la connexion est
compatible avec la métrique, la métrique est toujours transportée parallèlement
car elle respecte:
|
<TBODY> |
(3.33) </TBODY> |
Il
s'ensuit que le produit scalaire de deux vecteurs transportés parallèlement est
conservé. Si Vmet Wn sont transportés parallèlement sur une courbe xs (
), nous avons :
|
<TBODY> |
(3.34) </TBODY> |
Cela
signifie que le transport parallèle suivant une connexion compatible avec la
métrique conserve la norme des vecteurs, l'orthogonalité entre autres. Parlons
de quelque chose qu'on trouve rarement dans les livres sur la Relativité Générale
et qui est l'écriture explicite de la solution générale de l'équation de
transport parallèle.
Remarquons
que pour un chemin g:
![]()
xs (
), résoudre l'équation de transport parallèle pour un
vecteur Vm revient à trouver une matrice Pmr (
,l0) qui relie la valeur initiale du vecteur Vm (l0)
à sa valeur ultérieure en un point du chemin.
|
<TBODY> |
(3.35) </TBODY> |
Evidemment
la matrice Pmr (
,l0) appelée le propagateur
parallèle dépend du chemin g ( il n'est pas simple de trouver une notation qui
l'indique sans faire passer g
pour un index. Si nous définissons
|
<TBODY> |
(3.36) </TBODY> |
Où
la quantité à droite est évaluée à xn (
), alors l'équation du transport parallèle devient :
|
<TBODY> |
(3.37) </TBODY> |
Et
comme le propagateur parallèle doit s'appliquer à n'importe quel vecteur, en
reportant (3.35) dans (3.37) on voit que Pmr (
,l0) satisfait à l'équation :
|
<TBODY> |
(3.38) </TBODY> |
Intégrons
chaque membre pour résoudre l'équation :
|
<TBODY> |
(3.39) </TBODY> |
Le
symbole de Kronecker delta, est là pour normaliser l'équation pour
= l0.
Nous
pouvons résoudre (3.39) par itération, en prenant le membre de droite et en le
substituant dans l'expression correspondant au membre de gauche, autant que
nécessaire, pour donner :
|
<TBODY> |
(3.40) </TBODY> |
Le
terme de rang n de cette série est
une intégrale sur un triangle rectangle à
n dimensions (n-simplex).
|
<TBODY> |
Il
serait plus simple de considérer une telle intégrale sur un hyper cube de
dimension n au lieu d'un n-simplex, y a-t-il un moyen de le faire
? Il y a n! simplex de ce type dans
l' hyper cube correspondant, donc nous devons multiplier par 1/n! pour compenser le volume
supplémentaire.
Mais
nous voulons aussi obtenir l'intégrale correcte, en utilisant la notation
matricielle, l'intégrale à l'ordre n
est A(hn)A(hn-1)
... A(h1),
avec la propriété que hn ³ hn-1 ³ …³h1.
Nous allons définir un symbole
d'ordonnancement du chemin,
, pour s'assurer que la condition est remplie.
Autrement dit l'expression:
|
<TBODY> |
(3.41) </TBODY> |
Indique
que le produit des n matrices A(hi ),
est ordonné de sorte que la valeur la plus grande de hi est
à gauche, et que les valeurs suivantes hi sont
classées dans l'ordre décroissant.
Nous
pouvons alors exprimer le terme d'ordre n de (3.40) ainsi :
|
<TBODY> |
(3.42) </TBODY> |
Cette
expression ne contient aucune allusion au sujet des matrices A(hi );
c'est juste une notation. Nous pouvons écrire (3.40) sous forme matricielle
ainsi :
|
<TBODY> |
(3.43) </TBODY> |
Cette
formule correspond au développement en série d'une exponentielle, nous en
déduisons que le propagateur parallèle est défini une exponentielle sur un
chemin ordonné.
|
<TBODY> |
(3.44) </TBODY> |
Où
répétons-le, ce n'est qu'une notation, l'exponentielle sur le chemin ordonné
est définie comme le membre de droite de (3.43). Nous pouvons donc l'expliciter
ainsi :
|
<TBODY> |
(3.45) </TBODY> |
Il
est agréable de disposer d'une formule explicite, même si elle est un peu
abstraite. Le même genre d'expression apparaît dans la théorie quantique des
champs (Formule de Dyson), pour la bonne raison que l'opérateur, traduisant
l'évolution dans le temps de l'équation de Schrödinger, a la même forme que
celui décrit par (3.38).
Signalons
qu'un exemple particulièrement intéressant d'étude du propagateur parallèle est
son action sur une boucle (partant et arrivant au même point). S'il s'agit
d'une connexion métrique, la matrice résultante va correspondre à une
transformation de Lorentz dans l'espace tangent au point en question.
Cette
transformation est appelée "l'holonomie" de la boucle. Si on connaît
l'holonomie de toutes les boucles possibles, cela revient à connaître la
métrique.
Ceci
a conduit Ashtekar et ses collaborateurs à considérer la Relativité générale
sous l'angle de la représentation par boucle où les variables fondamentales
sont les holonomies en lieu et place de la métrique explicite.
Cette approche leur a permis de progresser
dans la voie de la quantification de la RG sans pour autant atteindre le but
recherché et entrevoir une piste pour cela.
Le
transport parallèle maîtrisé, nous pouvons maintenant nous attaquer à
l'équation géodésique. Une géodésique est la généralisation aux espaces courbes
de la notion de ligne droite de l'espace Euclidien. Nous avons tous ce qu'est
une ligne droite, c'est le plus court chemin entre deux points. Nous pouvons en
donner une autre tout aussi valable :
Une
ligne droite est un chemin qui transporte parallèlement son propre vecteur
tangent.
Dans
une variété munie d'une connexion quelconque (pas nécessairement de Christoffel),
ces deux concepts ne coïncident pas, nous les examinerons séparément.
Prenons
la deuxième définition, en premier, qui se révèle plus simple à calculer. Le
vecteur tangent à un chemin xm (
) est dxm /d
. La condition de transport parallèle s'exprime par :
|
<TBODY> |
(3.46) </TBODY> |
Ou alternativement
|
<TBODY> |
(3.47) </TBODY> |
Ceci
est l'équation géodésique, une autre
formule que nous devons absolument retenir.
Elle
se ramène à la notion de ligne droite en espace Euclidien si les coefficients
de connexion sont ceux de Christoffel, car en coordonnées cartésiennes Gmrs= 0, et l'équation devient d2xm/dl²= 0, ce qui correspond à celle d'une droite.
C'est
presque trop simple.
Examinons
maintenant la première définition (distance minimum).
Nous
avons déjà eu affaire aux subtilités liées à la notion de distance dans un
espace-temps lorentzien.
Pour
les chemins lumière, la distance est nulle, pour les chemins de type temps, le
mieux est d'utiliser le temps propre etc.
Pour
simplifier considérons le cas des chemins de type temps, la solution va se
révéler exacte pour tous les autres.
Considérons
la fonction temps propre.
|
<TBODY> |
(3.48) </TBODY> |
Où
l'intégrale s'applique le long du chemin.
Pour
rechercher les chemins de longueur minimum, nous allons utiliser le calcul
variationnel classique. (En fait l'extremum va se révéler être un maximum).
Considérons
comment varie le temps propre pour des variations infinitésimales du chemin.
|
<TBODY> |
(3.49) </TBODY> |
La
deuxième ligne reflète le développement en série de Taylor en espace courbe,
qui comme on le voit utilise la dérivée partielle, pas la dérivée covariante.
Reportons
ceci dans (3.48), nous obtenons :
|
<TBODY> |
(3.50) </TBODY> |
Comme
xsest supposé petit, nous pouvons développer la racine
carrée de l'expression entre crochets et trouver :
|
<TBODY> |
(3.51) </TBODY> |
Il
est utile de changer le paramétrage de notre courbe, en remplaçant
, qui était arbitraire en
lui-même, en utilisant :
|
<TBODY> |
(3.52) </TBODY> |
Reportons
dans (3.51) (note: nous le reportons pour toutes les occurrences de d
), on obtient
|
<TBODY> |
|
|
|
|
(3.53) </TBODY> |
Où
nous avons intégré par parties la dernière ligne, en évitant une contribution
aux limites en annulant δxs aux extrémités du chemin. Puisque nous le recherchons
pour des points fixes, δτ doit s'annuler
quelle que soit la variation, ceci implique:
|
<TBODY> |
(3.54) </TBODY> |
Où
nous avons utilisé dgms/dτ = (dxn/dτ)¶ngms.
Une
remise en ordre des index de sommation révèle que :
|
<TBODY> |
(3.55) </TBODY> |
Et si nous multiplions par la
métrique inverse on arrive finalement à :
|
<TBODY> |
(3.56)</TBODY> |
Nous
voyons que c'est également l'équation géodésique (3.32), mais pour une
connexion utilisant spécifiquement les coefficients de Christoffel (3.21).
Donc,
dans une variété munie d'une métrique, les extremums de la fonction de longueur
sont les courbes qui transportent parallèlement leur vecteur tangent, eu égard
à la connexion métrique de Christoffel.
Le
fait que d'autres connexions puissent être définies sur la même variété, n'a
aucune importance.
Evidemment en Relativité Générale nous
n'utiliserons que la connexion métrique de Christoffel, ce qui fait que les
deux définitions sont équivalentes.
L'intérêt
principal des géodésiques en Relativité Générale est qu'elles représentent les
chemins suivis par les particules non accélérées.
En
fait l'équation géodésique peut être interprétée comme la généralisation de la
loi de Newton f= ma pour le cas où f = 0.
Il
est aussi possible d'introduire des forces en ajoutant des termes au membre de
droite, en fait si nous faisons un retour en arrière vers l'expression (1.103)
exprimant la force de Lorentz en Relativité Restreinte, on peut se douter que
l'équation du mouvement pour une particule de masse m et de charge q en
Relativité générale va être quelque chose qui va ressembler à :
|
<TBODY> |
(3.57) </TBODY> |
Nous
développerons ce point ultérieurement, et confirmerons cette intuition.
Bien
qu'ayant développé ces expressions avec une certaine témérité, nous nous devons
préciser, tout de même, la notion de paramétrage d'un chemin géodésique.
Nous
avons paramétré notre chemin par un paramètre λ, quand nous avons
introduit la géodésique en tant que courbe représentant le transport parallèle
de son vecteur tangent (3.47), alors que nous avons pris le temps propre comme
paramètre lorsque nous avons défini la géodésique comme extremum de
d'intervalle d'espace-temps (3.56). Ceci mérite une clarification. Une
transformation telle que,
|
<TBODY>τ→λ = aτ +b |
(3.58) </TBODY> |
pour
des constantes a et b,
laisse l'équation invariante.
Tout
paramètre en relation de ce type avec le temps propre est appelé un paramètre affine et est aussi valide
que le temps propre lui-même pour caractériser la géodésique.
Ce qui est implicite (mais caché) derrière
notre formulation de (3.47) est que
l'exigence de transport parallèle du vecteur tangent contraint le paramétrage
de la courbe à être dépendante du temps propre, tel que défini en (3.58).
Autrement
dit, si on se place en un point, qu'on pointe dans une direction initiale, et
qu'on construit une courbe en commençant par marcher dans cette direction
initiale et en conservant le vecteur tangent à la courbe transporté
parallèlement, on ne définit pas seulement un chemin dans la variété, mais
aussi (à une transformation linéaire près) un paramètre le long du chemin. Rien
n'empêche d'utiliser un autre paramétrage, mais alors (3.47) ne sera plus satisfait.
Plus
généralement il satisfera une équation de la forme :
|
<TBODY> |
(3.59) </TBODY> |
Pour un paramètre α(λ), où f(α) est lié au paramètre affine par
f(α) = -
(d²α/dλ²)(dα/dλ)-2
Inversement,
si (3.59) est satisfait le long d'une
courbe, il existe un paramètre affine λ(α)
qui
satisfait l'équation géodésique (3.47).
Pour les chemins temporels nous pouvons écrire l’équation géodésique soit en termes de 4-vitesse Uµ = dxµ/dτ par :
Uµ (Uν);µ = 0.
Soit de façon équivalente en termes de 4-impulsion pµ = m.Uµ par :
pµ (pν);µ = 0.
Cette expression montre que des particules en chute libre continuent leur mouvement dans la direction pointée par leur impulsion
Pour les chemins nuls, comme le temps propre s’annule, τ n’est pas un paramètre affine valide.
Cependant il est parfaitement légitime de se demander si un chemin paramétré xµ(λ) satisfait l’équation géodésique. Si un chemin nul est une géodésique pour un paramètre λ, ce sera aussi une géodésique pour un autre paramètre affine de la forme aλ +b.
Cependant il n’y a pas de choix préférentiel parmi ces paramètres à la différence du cas des chemins temporels où c’est le temps propre qui s’impose.
Quand nous aurons choisi un paramètre en un point sur le chemin, il va y avoir une continuation unique pour le reste du chemin si nous voulons satisfaire à l’équation géodésique. Il est souvent approprié de choisir la normalisation du paramètre affine λ sur une géodésique nulle de sorte que dxµ/dλ soit égal au vecteur 4-impulsion.
pµ = dxµ/dλ
Notons la différence avec le cas des chemins
temporels où l’expression ci-dessus désigne la 4-impulsion par unité de masse.
Alors un observateur de 4-vitesse Uµ mesure l’énergie de la
particule (ou de façon équivalente la fréquence du photon, si nous posons h
=1) égale à :
E = -pµUµ
Cette expression nous donne toujours l’énergie d’une « particule » de 4-impulsion pµ mesurée par un observateur de 4-vitesse Uµ, que pµ soit nul ou de type temps ; ce que nous pouvons vérifier dans les coordonnées locales inertielles.
Attention cette expression pour E n’inclut pas l’énergie potentielle mais seulement l’énergie intrinsèque du mouvement et d’inertie.
Dans un espace-temps général, la notion d’énergie potentielle de gravitation n’est pas toujours bien définie, même si dans certains cas particuliers c’est le cas.
Une
propriété importante des géodésiques dans un espace-temps muni d'une
métrique Lorentzienne est que le type de
l'intervalle d'espace-temps (Temps/nul/espace) de la géodésique (dans le cadre
d'une connexion métrique) ne change pas.
C'est
dû au fait que le transport parallèle conserve le produit scalaire et que le
type d'intervalle d'espace-temps correspond au produit scalaire du vecteur
tangent par lui-même.
C'est
pourquoi nous étions fondés à considérer des chemins purement temporels quand
nous avons établi (3.56); pour les
chemins de type spatial pur nous aurions obtenu le même résultat au signe près.
Les
géodésiques nulles satisfont aussi la même équation, sauf que le temps propre
ne peut pas être utilisé (d'autres paramètres valides existent, liés par des
transformations linéaires).
On
peut établir cela soit à partir de la contrainte de transport parallèle du
vecteur, soit en généralisant la variation de (3.48) pour y inclure les chemins
de type autre que spatial.
Expliquons
maintenant pourquoi les géodésiques de type temps maximisent le temps propre.
Etant donnée une courbe de type temps (géodésique ou quelconque), nous pouvons
essayer de l'approximer, jusqu'à une
précision arbitrairement donnée, par une courbe de type nul.
A
cet effet, nous considérons une ligne brisée constituée de segments de courbes
de type nul, encadrant la courbe de type temps comme décrit ci-dessous
Si,
nous augmentons le nombre de segments, nous allons pouvoir réaliser une
meilleure approximation tout en conservant un chemin de type nul.
Les
géodésiques de type temps ne peuvent donc pas être des courbes qui minimisent
le temps propre puisqu'elles peuvent être arbitrairement proches de courbes de
temps propre nul, en fait elles maximisent le temps propre. (Note JF : Le
temps propre, positif, est un extremum. Comme il existe des chemins, entre les
deux extrémités considérées, de temps propre nul, les lignes brisées, cet
extremum ne peut être qu’un maximum).
Rappelez-vous
le paradoxe de jumeaux, celui qui reste à la maison, reste sur la géodésique,
et subit le temps propre maximum.
Soulignons ce que ces propos ont de cavalier.
Chaque fois que nous disons "maximise" ou "minimise" nous
devrions préciser "localement".
Il
n'est pas rare qu'entre deux points d'une variété, il y ait plus d'une géodésique.
Par
exemple sur S2 nous pouvons tracer un grand cercle entre deux
points, définissant deux arcs "extremum" entre les deux points mais
de longueurs manifestement différentes.
Un
dernier point à souligner, sur les géodésiques avant de passer à la courbure
elle-même, est leur utilisation pour relier l'espace tangent à un point p au voisinage local de p.
Remarquons
que toute géodésique xm (
) qui passe par
p peut être spécifiée par son
comportement en p.
Choisissons
(p) = 0 comme valeur du paramètre et le
vecteur tangent en p tel que
|
<TBODY> |
(3.60) </TBODY> |
Tel
que km soit un vecteur en p (un élément de Tp).
Alors, il n'y a qu'un point de la variété M
appartenant à cette géodésique correspondant à la valeur
= 1.
Nous
définissons la carte exponentielle à
p, expp : Tp
M, via,
|
<TBODY> |
(3.61) </TBODY> |
où
xn (
) est solution de l'équation géodésique compte tenu
de (3.60).
Pour
un ensemble de vecteurs tangents k
près du vecteur zéro, cette carte est parfaitement
définie et en fait inversible.
Donc
au voisinage de p, donné par la portée de la carte, pour cet ensemble de vecteurs
tangents, les vecteurs tangents eux-mêmes définissent un système de coordonnées
sur la variété.
Dans
ce système de coordonnées, toute géodésique passant par p s'exprime simplement par
|
<TBODY> |
(3.62) </TBODY> |
Pour
un vecteur k m approprié.
Le
domaine peut ne pas être tout l'espace tangent Tp car une géodésique peut se terminer sur une
singularité qui peut être interprété comme un "bord de la variété".
Les variétés qui incluent de telles singularités sont dits à géodésique incomplète.
La
portée peut aussi ne pas être toute la variété car des points peuvent ne pas
être reliés par une géodésique ou à l'inverse plusieurs géodésiques issues du
même point peuvent se couper.
Sans trop rentrer dans les détails des propriétés de la carte exponentielle, du fait que nous l'utiliserons peu, il était important de souligner que la portée de la carte n'est pas nécessairement la variété entière et que le domaine n'est pas tout l'espace tangent. Dans un espace muni d'une métrique à signature Euclidienne cette restriction est impossible, mais elle est possible dans un espace-temps lorentzien.
Développons toutefois une application intéressante de la carte exponentielle. Elle peut être utilisée pour construire des coordonnées localement inertielles. Cherchons des vecteurs de base {ê(µ')} dans Tp tels que les composantes de la métrique prennent la forme canonique:
gµ'ν'(p) =g({ê(µ')} {ê(ν')} )= ημ'ν'
Ici g( , ) dénote la métrique considérée comme une forme bilinéaire de Tp x Tp vers R, ê dénote un vecteur de base, et les « ' » dénotent la métrique localement inertielle.
Ceci est direct car simplement de l'algèbre linéaire.
Partant de n'importe quel ensemble de composants pour gµν, nous pouvons toujours diagonaliser la matrice et normaliser les vecteurs de base de façon à obtenir la forme canonique.
Ce qui est plus délicat c'est de trouver un système de coordonnées xµ' pour lequel les vecteurs de base {ê(µ')} satisfont à {ê(µ')} = ∂µ' et ∂σ'gμ'ν' = 0.
En fait la carte exponentielle nous en donne la solution.
Pour tout point q suffisamment proche de p il y a un chemin géodésique unique reliant ces deux points et un paramétrage unique de λ telle que λ(p) = 0 et λ(q) = 1.
En p le vecteur tangent k à cette géodésique peut s'écrire comme une combinaison linéaire de nos vecteurs de base, k = kµ'ê(µ').
Les coordonnées recherchées xµ' sont les coordonnées xµ'(q) = kµ'.
Autrement dit nous avons défini les coordonnées xµ'(q) comme les composantes (dans notre base normalisée {ê(µ')} du vecteur tangent k relié à q par exp p.
Coordonnées Normales de Riemann
Ces
coordonnées sont appelées les coordonnées normales de Riemann. Nous devons
vérifier que ces coordonnées normales de Riemannn satisfont à ∂σ'gμ'ν'
= 0.
Notons qu'un ensemble de vecteurs de la forme λkµ', pour un vecteur kµ' donné est relié à la géodésique par la carte exponentielle. Donc en coordonnées normales de Riemann, une courbe xµ'(λ) de la forme
xµ'(λ) = λkµ',
va satisfaire l'équation géodésique.
En fait, toute géodésique passant par p peut être exprimée de la sorte, pour un vecteur kµ' approprié. Nous avons donc
d²xµ'/dλ² = 0
sur toute géodésique passant par p dans ce système de coordonnées. Mais par l'équation géodésique nous avons également:
d²xµ'/dλ² (p) = -Γμ'ρ'σ'(p)kρ'kσ'
où kρ'
= dxρ'/dλ. Comme ceci est valide pour kρ'
arbitraire, nous en déduisons que: Γμ'ρ'σ'(p)=
0.
Utilisons maintenant la compatibilité métrique qui s'écrit:
0 = (gμ'ν' );σ = ∂σ'gμ'ν' -Γ λ'σ'μ' gλ'ν' - Γ λ'σ'ν' gμ'λ' = ∂σ'gμ'ν' .
Ceci étant évalué au point p.
Nous voyons que les coordonnées normales de Riemann nous fournissent une solution pour des coordonnées localement inertielles. Elles ne sont pas uniques: Il existe une infinité de systèmes de coordonnées dans lesquels gµ'ν'(p) = ημ'ν', et ∂σ'gμ'ν' = 0, mais si on les développe en série autour de p ils ne diffèrent des coordonnées normales de Riemann qu'au troisième ordre en xµ'.
Ce
n'est pas seulement un problème pour les mathématiciens pointilleux, car les
"théorèmes de singularités" de Hawking et Penrose stipulent que sous
condition d'un contenu de matière réaliste (pas d'énergie négative), il est
pratiquement certain que l'espace-temps soit du type géodésiquement incomplet.
Par
exemple les deux modèles d'espace-temps les plus utilisés en Relativité
Générale - la solution Schwarzschild décrivant les trous noirs et la solution
de Friedmann-Robertson-Walker décrivant les Cosmologies homogènes, isotropes
comportent toutes les deux des singularités importantes.
Maintenant
que nous avons établi les mécanismes de transport parallèle et les dérivées
covariantes, nous sommes prêts pour aborder la courbure proprement dite.
La
courbure est mesurée par le tenseur de Riemann, qui est lui-même construit à
partir de connexions.
La
mesure de la courbure suppose que nous ayons la notion de "platitude"
d'une connexion, la connexion conventionnelle (et habituellement implicite) de
Christoffel associée à une métrique Euclidienne ou Minkowski dispose d'un
certain nombre de propriétés que l'on peut associer à la platitude.
Ceci
comprend la propriété de conserver un vecteur, lorsqu'il est transporté le long
d'une courbe fermée, que les dérivées covariantes des tenseurs sont
commutatives, et que des géodésiques initialement parallèles le restent.
Le
tenseur de Riemann est introduit pour étudier comment ces propriétés sont
altérées dans un contexte plus général.
Nous
avons déjà montré comment un vecteur transporté parallèlement sur une courbe
fermée (boucle) d'une sphère S² était altéré.
L'altération
dépend de la courbure totale embrassée par la boucle.
Il
est plus utile d'avoir une description locale de la courbure en tout point, ce
que le tenseur de Riemann est censé nous procurer.
Une
manière classique d'introduire le tenseur de Riemann est d'effectuer un
transport parallèle, le long d'une boucle infinitésimale.
Nous
ne suivrons pas cette voie et irons directement au but.
Beaucoup
d'ouvrages sont sur ce point soit un peu flottants, soit corrects mais abscons.
Néanmoins,
sans s'embarrasser des détails, nous pouvons voir la forme que la solution doit
prendre. Transportons un vecteur Vs sur une boucle définie par deux Vecteurs Am et Bn:
Les
longueurs infinitésimales des côtés de la boucle sont
a et
b, respectivement.
Comme
nous savons que l'action d'un transport parallèle est indépendante des
coordonnées, un tenseur doit nous indiquer le changement opéré sur le vecteur
par le parcours lorsqu'il revient à son point de départ.
Ce
doit être une transformation linéaire sur ce vecteur et implique donc un indice
et un exposant (pour redonner un vecteur en sortie). Mais il va aussi dépendre
des deux vecteurs A et B qui définissent la boucle, donc nous
allons trouver deux indices pour opérer sur ces vecteurs Am et Bn et les contracter.
De
plus, le tenseur doit être antisymétrique sur ces deux indices, car changer les
vecteurs correspond à effectuer le parcours dans l'autre sens, ce qui donne un
résultat inverse.
Ceci
est cohérent avec une transformation à l'identique (modification nulle) si les
vecteurs A et B sont identiques. La forme de l'expression traduisant le
changement
Vr , suite au parcours sur la boucle, se déduit
immédiatement :
|
<TBODY> |
(3.63) </TBODY> |
où
Rrsmn
est un tenseur (1, 3) appelé le tenseur
de Riemann (ou simplement
"tenseur de courbure"). Il est
antisymétrique sur ses deux derniers indices.
|
<TBODY> |
(3.64) </TBODY> |
Si
(3.63) représente la définition de tenseur de Riemann, il faut respecter la
convention sur l'ordre des indices, soyons attentifs, car cette convention est
arbitraire.
Sachant
ce qu'est un transport parallèle, nous pouvons décrire très précisément ce qui
arrive au vecteur au cours de cette opération, et le résultat va être une
formule fonction des connexions métriques.
Le
plus rapide est de considérer une opération connexe, le commutateur (différence
entre les permutations) de deux dérivées covariantes.
Sa
relation avec le transport parallèle le long d'une boucle saute aux yeux, car
la dérivée covariante dans une certaine direction mesure le changement du
vecteur par rapport à ce qui aurait été s'il avait été transporté parallèlement
au même point (rappelons que par définition elle est nulle pour un transport
parallèle).
Le
commutateur de deux dérivées covariantes mesure la différence entre le
transport parallèle d'abord dans une direction, puis dans l'autre et l'inverse.
Le
calcul est direct. Considérons un champ de vecteurs Vr, nous avons :
|
<TBODY> |
(3.65) </TBODY> |
Dans
la dernière étape nous avons renommé les indices de sommation et éliminé les
termes qui s'éliminent par anti-symétrisation.
Nous
reconnaissons que le dernier terme est simplement le tenseur de torsion et que
le membre de gauche est manifestement un tenseur, donc le terme entre
parenthèses est un tenseur.
Nous
écrirons :
|
<TBODY> |
(3.66) </TBODY> |
Où le tenseur de Riemann vaut
:
|
<TBODY> |
(3.67) </TBODY> |
L'établissement
de cette expression appelle les remarques suivantes : Evidemment nous n'avons
pas démontré que (3.67) est vraiment le même tenseur que celui défini en
(3.63), Mais c'est le même (voir Wald pour une démonstration crédible mais
tortueuse).
Il
peut paraître surprenant que le commutateur [ÑmÑn],
qui est un opérateur différentiel, agit multiplicativement (en l'absence de
torsion, à n'importe quel niveau) sur un champ de vecteurs. Le tenseur de
Riemann contient la mesure de la part qui est proportionnelle au champ de
vecteurs dans le commutateur, alors que le tenseur de torsion contient la
mesure de la part qui est proportionnelle à la dérivée covariante du champ de
vecteurs.
A
noter l'absence de dérivées secondes. Remarquons que l'expression de (3.67) est constituée d'éléments non tensoriels,
mais nous pouvons vérifier par les lois de transformation que le résultat est
un authentique tenseur. L'antisymétrie de Rrsmn
sur
ses deux derniers indices est immédiate, au vu de la formule et de son
établissement.
Nous
avons construit le tenseur de courbure directement à partir de la connexion,
sans référence à la métrique. Nous avons pris soin d'établir la formule de
façon à ce qu'elle soit valable quelle que soit la connexion (métrique ou non)
indépendamment de la torsion. En utilisant notre technique habituelle nous
pouvons généraliser l'action de l'opérateur [ÑrÑs]
sur
un tenseur de rang quelconque :
Cela
donne :
|
<TBODY> |
(3.68) </TBODY> |
Une
notion utile est le commutateur de deux champs de vecteurs qui est un troisième
champ de vecteurs de composantes :
|
<TBODY> |
(3.69) </TBODY> |
Le
tenseur de Riemann et le tenseur de torsion qui sont tous deux des applications
multilinéaires, ont des expressions élégantes en termes de commutateur. Si on
considère la torsion comme une application multilinéaire entre deux champs de
vecteurs en produisant un troisième nous avons :
|
<TBODY> |
(3.70) </TBODY> |
Et
si on fait de même pour le tenseur de Riemann, nous avons :
|
<TBODY> |
(3.71) </TBODY> |
Dans
ces expressions, la notation ÑX
représente la dérivée covariante le long du champ de vecteur X, de composantes ÑX= XmÑm.
Remarquons
que les vecteurs X et Y dans (3.71)
correspondent aux deux indices antisymétriques dans la forme décrivant les
composantes du tenseur de Riemann.
Le
dernier terme de (3.71), relatif au commutateur [X, Y], s'annule quand X et Y
forment une base des champs de vecteurs car [¶m, ¶n]
= 0, ce qui explique que ce terme ne soit pas présent dans notre formule
originale du commutateur de dérivées
covariantes.
Nous
n'utiliserons pas souvent cette notation, mais vous pourrez être amenés à la
rencontrer, autant savoir ce qu'elle signifie.
Ayant
défini le tenseur de courbure comme un objet qui caractérise la connexion, en
Relativité Générale, nous utiliserons essentiellement la connexion métrique
(Christoffel).
Dans
ce cas la connexion dérive directement de la métrique, et la courbure peut à
juste titre être interprétée comme celle de la métrique elle-même. Cette
identification donne un sens à notre
notion informelle qui nous fait assimiler les espaces pourvus de métriques de
type Euclidien ou Minkowskien à des espaces plats.
En
fait, dans un espace où les composantes de la métrique sont constantes, dans un
certain système de coordonnées, le tenseur de Riemann est nul, et réciproquement
si le tenseur de Riemann est nul, on peut trouver un système de coordonnées où
les composantes de la métrique sont constantes.
La
première proposition est immédiate, car si dans un système de coordonnées, ¶sgmn
= 0 (en tous points), alors Grmn=
0 et ¶s Grmn =
0; donc Rrsmn
=
0 par (3.67).
Comme
c'est une équation tensorielle, si c'est vrai dans un système de coordonnées,
c'est vrai dans tous.
Donc
la nullité du tenseur de Riemann est une condition nécessaire pour pouvoir
trouver un système de coordonnées où les composantes du tenseur métrique gmn
sont constantes partout.
C'est
aussi une condition suffisante, bien que ce soit un peu plus difficile de la
montrer. Commençons par choisir une système de coordonnées Normales de Riemann
au point p, tel que gmn
=
hmn
en p. (Ici nous utilisons hmn
dans le sens général d'une matrice diagonale d'éléments +1 où -1 . L'arrangement des +1's et -1's dépend de la forme canonique de
la métrique, mais n'apporte rien dans la présente argumentation. Notons les
vecteurs de base en p par ê(m), de composantes ês(m), .
Par construction, nous avons :
|
<TBODY> |
(3.72) </TBODY> |
Réalisons
maintenant un transport parallèle de la base entière de p vers un autre point q,
La nullité du tenseur de Riemann nous garantit que ce transport va être
indépendant du chemin pris entre p et
q. Comme un transport parallèle sur
une connexion métrique conserve le produit scalaire, cela implique :
|
<TBODY> |
(3.73) </TBODY> |
Nous
avons donc défini une base dans laquelle les composantes de la métrique sont
constantes. Cela paraît totalement anodin, et peut être réalisé dans n'importe
quelle variété, indépendamment de la courbure. Ce que nous voulons montrer est
que ceci est une base de coordonnées (ce qui ne sera vrai que si la courbure
est nulle). Nous savons que si les vecteurs ê(m)
sont
une base de coordonnées, leur commutateur s'annule :
|
<TBODY> |
(3.74) </TBODY> |
Ce
que nous cherchons, c'est la réciproque : Si le commutateur s'annule, nous
pouvons trouver des coordonnées ym telles que ê(m)
= ¶/¶ym.
Le
théorème de Frobenius nous confirme
l'exactitude de cette hypothèse.
La
démonstration est plutôt touffue et faire appel à un arsenal mathématique
conséquent, nous l'admettrons donc et les esthètes pourront toujours se
rassurer en consultant Schutz's (Geometrical
Methods).
Malgré
tout, nous voudrions démontrer (3.74) pour les champs de vecteurs que nous
avons établis. Utilisons (3.70) définissant la torsion:
|
<TBODY> |
(3.75) </TBODY> |
La
torsion est nulle par hypothèse. La dérivée covariante s'annule aussi, compte
tenu de la méthode de construction du champ de vecteurs (ils résultent d'un
transport parallèle sur des chemins arbitraires. Si ces champs ont été
transportés sur des chemins quelconques, en particulier ils peuvent être
transportés le long des vecteurs ê(m), ,
et leurs dérivées covariantes dans cette direction vont être nulles.
Alors
(3.70) implique que le commutateur s'annule et que par conséquent nous pouvons
trouver un système de coordonnées ym dont ces champs de vecteurs sont les dérivées
partielles. Dans ce système de coordonnées la métrique va avoir les composantes
hmn, comme souhaité.
Le
tenseur de Riemann, du fait de ses 4 index a n4 composantes dans un espace à n-dimensions L'antisymétrie du tenseur (3.64) réduit à n(n
- 1)/2 le nombre de composantes indépendantes sur les deux derniers index et
nous laisse n3(n - 1)/2 composantes indépendantes.
Si
nous considérons une connexion de Christoffel, nous trouvons d'autres symétries
qui réduisent encore ce nombre de composantes indépendantes. Intéressons-nous à
cela :
Construisons
le tenseur de Riemann avec tous les index bas :
|
<TBODY> |
(3.76) </TBODY> |
Considérons
les composantes de ce tenseur en Coordonnées Normales de Riemann au point p.
Alors les symboles de Christoffel vont s'annuler, bien que leurs dérivées ne
s'annulent pas.
Nous
avons donc
|
<TBODY> |
|
|
|
(3.77) </TBODY> |
|
Dans
la seconde ligne nous avons utilisé le fait que
¶mglt = 0 en coordonnées normales de Riemann et dans la
troisième ligne, le fait que les dérivées partielles commutent. De cette
expression, nous remarquons immédiatement deux propriétés de Rrsmn.
Il est antisymétrique dans ses deux premiers indices,
|
<TBODY> |
(3.78) </TBODY> |
Et
il est invariant par l'échange de la première paire d'indices avec la seconde.
|
<TBODY> |
(3.79) </TBODY> |
En
poursuivant l'étude (ce que nous vous laissons le soin de faire) nous mettrions
en évidence que la somme de des permutations cycliques sur les trois derniers
indices est nulle.
|
<TBODY> |
(3.80) </TBODY> |
Cette
dernière propriété peut s'énoncer comme la nullité de la partie antisymétrique
sur les trois derniers indices, soit :
|
<TBODY> |
(3.81) </TBODY> |
Toutes
ces propriétés ont été établies dans un système de coordonnées particulier,
mais s'agissant d'équations tensorielles, si elles sont valables dans un
système de coordonnées, elles le sont dans tous.
Ces
propriétés ne sont pas toutes indépendantes, et moyennant un petit effort, on
peut trouver que (3.64), (3.78) et (3.81) ensembles impliquent (3.79).
L'interdépendance logique ne doit pas nous troubler outre mesure, l'important
est l'existence de ces propriétés.
Compte
tenu de toutes ces relations entre les composantes, combien en reste-t-il
d'indépendantes?
Commençons
par l'antisymétrie de Rrsmn sur
ses deux premiers indices, sur ses deux derniers indices, et la symétrie entre
ces paires. Nous pouvons nous représenter cela par une matrice symétrique R[rs][mn], où les paires rs et
mn
jouent le rôle d'index. Une matrice symétrique m × m a m(m
+ 1)/2 composantes indépendantes alors qu'une matrice n × n antisymétrique a n(n
- 1)/2 composantes indépendantes. Il s'ensuit que le nombre de composantes
indépendantes est :
|
<TBODY> |
(3.82) </TBODY> |
Nous
n'avons pas encore tenu compte de (3.81). L'effet immédiat de (3.81) est que la
totalité de la partie antisymétrique du tenseur de Riemann s'annule :
|
<TBODY> |
(3.83) </TBODY> |
En
fait, cette équation, plus les autres symétries (3.64), (3.78) et (3.79)
impliquent (3.81), ce qui peut être montré facilement en développant (3.83) et
en réarrangeant les termes résultants. Donc
(3.83) est équivalent à appliquer (3.81), quand les autres symétries ont
été appliquées. Combien de contraintes complémentaires résultent de cette
relation ? Décomposons comme suit :
|
<TBODY> |
(3.84) </TBODY> |
Il
est facile de voir que tout tenseur à 4 index entièrement antisymétrique est
bien sur antisymétrique entre ses premiers et derniers indices, et symétrique
par échange des deux paires. Donc ces propriétés sont des contraintes
indépendantes liées à (3.83), de Xrsmn,
de celles déjà prises en compte.
Un
tenseur totalement antisymétrique à 4 index a n(n - 1)(n - 2)(n - 3)/4! Termes indépendants, et donc (3.83) réduit le nombre de composantes indépendantes par
cette valeur. Il nous reste
|
<TBODY> |
(3.85) </TBODY> |
composantes indépendantes du
tenseur de Riemann.
En
quatre dimensions, le tenseur de Riemann a 20 composantes indépendantes. (En
une dimension, il n'en a aucune). Ces vingt fonctions correspondent précisément
aux vingt degrés de liberté des dérivées secondes de la métrique que nous
n'avions pas pu annuler par un changement de coordonnées. Cela devrait nous
conforter dans le choix de ce tenseur pour représenter la courbure de l'espace.
En plus des symétries algébriques du tenseur de Riemann, qui contraignent le
nombre de composantes indépendantes en chaque point, il obéit à une identité
différentielle qui contraint ses valeurs relatives en différents points.
Considérons
la dérivée covariante du tenseur de Riemann évalué en coordonnées normales
riemanniennes :
|
<TBODY> |
(3.86) </TBODY> |
Considérons
les permutations cycliques sur les trois premiers indices.
|
<TBODY> |
(3.87) </TBODY> |
Comme
c'est une équation tensorielle elle est vraie dans n'importe quel référentiel.
Nous voyons que l'antisymétrie Rrsmn = - Rsrmn , nous
permet d'écrire ce résultat sous la forme :
|
<TBODY> |
(3.88) </TBODY> |
Ceci
est appelé l'identité de Bianchi. (Remarquons que pour une
connexion quelconque nous aurions des termes supplémentaires relatifs au
tenseur de torsion. Elle est en relation étroite avec l'identité de Jacobi
(vous pouvez le démontrer) car au fond, elle exprime que
|
<TBODY> |
(3.89) </TBODY> |
Il
est souvent utile de considérer les contractions du tenseur de Riemann. Même
sans métrique, nous pouvons le contracter pour donner le tenseur de Ricci :
|
<TBODY> |
(3.90) </TBODY> |
Remarquons
que pour un tenseur de courbure formé à
partir de connexions quelconques (pas forcément de Christoffel), il y a
plusieurs contractions possibles. Notre intérêt principal portant sur la
connexion métrique (Christoffel), nous voyons que (3.90) est la seule
contraction indépendante possible, à la convention de signe près. Le tenseur de
Ricci associé à une connexion métrique est symétrique, du fait des symétries du
tenseur de Riemann.
|
<TBODY> |
(3.91) </TBODY> |
En
utilisant la métrique nous pouvons opérer une contraction complémentaire pour
produire le scalaire de Ricci :
|
<TBODY> |
(3.92) </TBODY> |
Une
forme particulièrement utile de l'identité de Bianchi est obtenue à partir de
(3.87) en la contractant deux fois,
|
<TBODY> |
(3.93) </TBODY> |
soit
|
<TBODY> |
(3.94) </TBODY> |
A
l'inverse de la dérivée partielle, il est parfaitement légal d'élever un index
sur la dérivée covariante, du fait de la compatibilité métrique. Si nous définissons le tenseur d'Einstein par :
|
<TBODY> |
(3.95) </TBODY> |
Nous
voyons que l'identité de Bianchi deux fois contractées (3.94) est équivalente à :
|
<TBODY> |
(3.96) </TBODY> |
Le
tenseur d'Einstein qui est symétrique du fait de la symétrie du tenseur de
Ricci et de la métrique est de la plus haute importance en Relativité générale.
Le
tenseur de Ricci et le scalaire de Ricci contiennent de l'information sur les
"traces" du tenseur de Riemann.
Il
est parfois utile de considérer séparément les morceaux du tenseur de Riemann
non décrit par le tenseur de Ricci. C'est le tenseur de Weyl, qui est construit à partir du tenseur de Riemann en lui
retirant toutes ses contractions. Il s'exprime en n dimensions par
|
<TBODY> |
(3.97) </TBODY> |
Cette
formule alambiquée est conçue de sorte que toutes les contractions possibles de
Crsmn
s'annulent, tout en retenant toutes
les symétries du tenseur de Riemann:
|
<TBODY> |
(3.98) </TBODY> |
Le
tenseur de Weyl n'est défini qu'à partir (et au-delà) de 3 dimensions, et en
trois dimensions, il est nul. Pour n ³ 4, il
satisfait une version de l'identité de Bianchi.
|
<TBODY> |
(3.99) </TBODY> |
Une
des propriétés les plus importantes du
tenseur de Weyl est qu'il est invariant par une transformation conforme.
Ceci
signifie que si on calcule Crsmn
pour une métrique gmn,
et qu'on le calcule de nouveau pour une métrique donnée par W² (x) gmn,
,
où
(x) est une
fonction non nulle de l'espace-temps, on obtient la même chose.
Pour
cette raison, il est souvent appelé le "tenseur conforme".
Après
ce déluge de formalisme, il est temps de souffler et de regarder ce que la
courbure signifie et représente sur des exemples simples.
Rappelons
que d'après (3.85), en 1, 2, 3 et 4 dimensions il y a respectivement 0, 1, 6 et
20 composantes indépendantes pour le tenseur de courbure.
Tout
ce que nous dirons dans ces exemples supposera que la courbure est définie sur
une connexion métrique.
Cela
signifie que les variétés unidimensionnelles (telles que S1) ne sont jamais courbées.
L'idée
que nous avons de la courbure d'un cercle vient que nous le pensons inclus dans
plan bidimensionnel.
Il
y a une notion de courbure extrinsèque qui caractérise la manière dont quelque
chose est inclus dans un espace de dimensions supérieures.
Nous
nous référons à la courbure intrinsèque qui n'a rien à voir avec de telles
inclusions.
La
distinction entre courbure intrinsèque et extrinsèque est également importante
en deux dimensions, où la courbure a une
composante indépendante (En fait toute l'information de courbure est contenue
dans l'unique composante du scalaire de
Ricci).
Considérons
un cylindre
× S1.
Bien
que de notre point vue, il nous paraisse courbe, il est pourtant clair que nous
pouvons définir une métrique sur le cylindre dont les composantes sont
constantes dans un système de cordonnées approprié, en simplement le déroulant
et utilisant la métrique du plan. Dans cette métrique le cylindre est plat. On
pourrait introduire d'autres métriques où le cylindre ne serait pas plat, mais
le point que nous voulons souligner est que cette métrique peut être rendue
plate. Même scénario pour le tore.
Nous
pouvons construire un tore (S1
× S1) à partir d'un carré
en joignant et collant les côtés opposés comme indiqué sur la figure. De
nouveau nous reconnaissons une métrique plate, bien que du point de vue extrinsèque,
il apparaisse de plus en plus courbe.
Un
cône est un exemple de variété à deux dimensions avec une courbure non nulle en
un seul point.
Ceci
se voit si on déroule le cône, il est alors équivalent à un plan amputé d'un
angle formé par les côtés opposés identifiés (angle de déficit).
De
la métrique résultant de cette définition, on voit que le cône est plat partout
sauf au sommet. Ceci peut être visualisé en transportant parallèlement un
vecteur sur diverses boucles. Si la boucle n'inclut pas le sommet, le vecteur
est inchangé, si la boucle inclut le sommet (disons une fois), alors le vecteur
subit une rotation d'un angle égal à l'angle de déficit.
La courbure de la sphère
Un exemple, que nous chérissons particulièrement, est
celui de la sphère S² munie de la métrique
|
<TBODY> |
(3.100) </TBODY> |
où
a est le rayon de la sphère (imaginé
représenté dans R3).
Sans entrer dans les détails, les coefficients non nuls de la connexion sont :
|
<TBODY> |
(3.101) </TBODY> |
Calculons une composante
intéressante du tenseur de Riemann :
|
<TBODY> |
|
|
|
|
(3.102) </TBODY> |
||
(La
notation est un peu confuse, car la lettre grecque
est un index de sommation alors que les lettres
grecques
et Freprésentent des coordonnées spécifiques. En abaissant
les index nous avons :
|
<TBODY> |
(3.103) </TBODY> |
C'est
un jeu d'enfant de vérifier que tous les autres composantes de tenseur de
Riemann sont nulles ou égale à celle-là par symétrie.
Continuons
en calculant le tenseur de Ricci via Rmn
= gabRambn,
nous obtenons :
|
<TBODY> |
(3.104) </TBODY> |
Le scalaire de Ricci
s'obtient aussi directement :
|
<TBODY> |
(3.105) </TBODY> |
Donc,
sur une variété à deux dimensions, le scalaire de Ricci caractérise
complètement la courbure qui est constante sur une sphère S². Ceci reflète la
propriété de "symétrie maximum" sur une variété, notion que nous
développerons ultérieurement, même cela vous paraît à juste titre évident. Dans
un espace de dimension quelconque, la courbure de l'espace à symétrie maximum
satisfait (pour une constante a) :
|
<TBODY> |
(3.106) </TBODY> |
Qui est vérifié par cet
exemple, comme de bien entendu.
Remarquons
que le scalaire de Ricci est constant pour la sphère et est de plus
positif. Nous dirons que la sphère
possède comme le scalaire de Ricci, une courbure positive (nonobstant des
conventions diverses qui au moins
convergent sur ce point). Du point de vue d'un observateur vivant dans
la variété, incluse dans un espace Euclidien de dimensions supérieures, s'il
est assis en un point d'un espace à courbure positive, il voit l'espace
s'incurver de la même façon dans toutes les directions, alors qu'assis en un
point d'un espace à courbure négative il le voit s'incurver de façon opposée
dans les différentes directions.
Les espaces 2D à courbure négative ressemblent
à des selles de cheval (sans le cheval, bien entendu).
Ceci
termine les exemples. Nous allons maintenant introduire, la déviation
géodésique.
Vous
savez sans doute que la géométrie Euclidienne s'appuie sur le postulat des
parallèles qui ne se rencontrent jamais. Dans un espace courbe, ceci n'est plus
vrai, sur une sphère, des géodésiques parallèles en un point peuvent se couper.
Nous nous devons de quantifier cette propriété dans un espace courbe
arbitraire. Premier problème, la notion de parallèle ne se généralise pas
naturellement d'un espace plat à un espace courbe.
Nous
allons donc construire une famille de géodésique à un paramètre gs
(t). Pour chaque s Î
, gs est
une géodésique paramétrée par le paramètre affine t. L'ensemble de toutes ces courbes définit une surface continue à
deux dimensions (inclus dans une variété M
de dimension supérieure quelconque). On peut choisir s et t, comme coordonnées
pourvu que nous ayons choisi une famille de géodésiques qui ne se coupent pas.
La surface entière est alors l'ensemble des points xm (s, t) Î M.
Nous avons deux champs de vecteurs naturels :
les vecteurs tangents aux géodésiques.
|
<TBODY> |
(3.107) </TBODY> |
Et les vecteurs de
"déviation "
|
<TBODY> |
(3.108) </TBODY> |
Cela
vient de la notion informelle que Sm pointe d'une géodésique vers ses voisines.
L'idée
que Sm pointe d'une géodésique vers la suivante suggère de
définir la "vitesse relative des géodésiques".
|
<TBODY> |
(3.109) </TBODY> |
et " l'accélération
relative des géodésiques,"
|
<TBODY> |
(3.110) </TBODY> |
Pour
les noms, ça se discute, mais ce qui est sûr c'est que ces vecteurs existent
bien. Comme S et T sont les vecteurs
de base du système de coordonnées, le commutateur s'annule.
[S, T] = 0.
Considérons
le cas standard ou la torsion est nulle, alors de (3.70) nous tirons :
|
<TBODY> |
(3.111) </TBODY> |
Tenant compte de cela,
calculons l'accélération :
|
<TBODY> |
(3.112) </TBODY> |
Examinons
cette expression ligne par ligne.
La
première ligne est la définition de aµ, et la seconde
ligne résulte de l'application de (3.111). L'application de la règle de Leibniz
donne la troisième ligne.
La
quatrième ligne est obtenue en remplaçant la double dérivée covariante par les
dérivées en sens contraires plus le
tenseur de Riemann.
La
règle de Leibniz est de nouveau utilisée pour produire la cinquième ligne (dans
l'ordre inverse à celui habituel), et nous éliminons deux termes identiques et
remarquons que le terme invoquant TrÑr Tm s'annule car Tm est un vecteur tangent à une géodésique.
Il
vient :
|
<TBODY> |
(3.113) </TBODY> |
Cette
formule est appelée l'équation de
déviation géodésique Elle exprime
quelque chose qui était prévisible : l'accélération relative entre deux
géodésiques est proportionnelle à la courbure.
D'un
point de vue physique, l'accélération entre géodésique voisines est interprétée
comme la manifestation des forces de marée.
Cela
nous rapproche de la physique.
Le
dernier aspect formel à traiter avant de nous intéresser à la gravitation
concerne le formalisme précis des connexions et de la courbure. Cette fois nous
allons utiliser un ensemble de vecteurs de bases de l'espace tangent qui n'est
pas dérivé d'un quelconque système de
coordonnées.
Il
apparaît que cette nuance, dans l'approche, nous révèle un autre aspect de la
connexion et de la courbure, où les relations avec les théories de jauge de la
physique de particules sont plus claires. Les concepts que nous introduisons
sont plutôt immédiats, mais la notation est cauchemardesque, ce qui fait
apparaître la chose plus complexe qu'elle n'est.
Jusqu'à
présent nous avons tenu compte du fait qu'une base naturelle de l'espace
tangent Tp à un point p est donné par les dérivées partielles
respectivement aux coordonnées en ce point ê(m)
= ¶m. Itou pour l'espace cotangent T*p où la base est
donnée par les gradients des fonctions des coordonnées,
= dxm. Rien ne nous interdit de prendre une autre base.
Supposons qu'en chaque point de la variété nous introduisons un ensemble de
vecteurs de base ê(a)
(indexé par une lettre latine plutôt que grecque pour nous rappeler que nous ne
faisons pas référence à un système de coordonnées).
Nous
choisirons ces vecteurs orthonormés, au sens approprié à la signature de la
variété que nous considérons. Si la forme canonique de la métrique est écrite hab,
nous imposons au produit scalaire des vecteurs de base la condition :
|
<TBODY> |
(3.114) </TBODY> |
Où g(
, ) est le tenseur métrique habituel. Alors dans un espace lorentzien hab,
représente la métrique de Minkowski, tandis qu'une signature définie positive
représentera une métrique d'espace Euclidien.
L'ensemble
des vecteurs constituant une base orthonormée est quelquefois appelée une
tétrade (grec), (vielbeins en allemand). Dans des espaces de dimensions
différentes ils sont selon la circonstance appelés triade (3), … etc. Comme nous ne pouvons pas en général
couvrir la variété avec un seul diagramme de coordonnées, nous ne pourrons pas
trouver un ensemble de vecteurs de bases définis partout. Nous procéderons
comme d'habitude par morceaux d'espaces et opérerons leur recollement sans
raccord en normalisant les recouvrements
par une application bijective;
Etant
donné cette base, un vecteur quelconque peut s'exprimer par une combinaison
linéaire des vecteurs de bases. En particulier nous pouvons exprimer nos
anciens vecteurs de base ê(m) =
¶m
en fonction des nouveaux :
|
<TBODY> |
(3.115) </TBODY> |
Les
composantes de eam forment une matrice
n × n inversible. (Conformément
à notre habitude de confondre les objets et leurs composantes, nous nous
réfèrerons à eam en
tant que tétrade, et souvent au pluriel à
"tétrades."). L'inverse
sera noté, en inversant les index ema, il satisfait
|
<TBODY> |
(3.116) </TBODY> |
Elles
sont les composantes des vecteurs ê(a)
dans la base de coordonnées:
|
<TBODY> |
(3.117) </TBODY> |
Exprimé en termes d'inverse
des triades, (3.114) devient
|
<TBODY> |
(3.118) </TBODY> |
Soit également
|
<TBODY> |
(3.119) </TBODY> |
La
dernière équation fait dire à certains que les tétrades sont les racines
carrées de la métrique.
Nous
pouvons faire de même pour établir une base orthonormée pour les formes
monolinéaires dans T*p,
que nous noterons
. Nous pouvons les choisir de façon à ce qu'ils soient
compatibles avec la base de vecteurs dans le sens où
|
<TBODY> |
(3.120) </TBODY> |
Comme
conséquence immédiate de ceci, les formes mono linéaires orthonormées sont
liées à leurs cousins
=
dxm définis dans la base de coordonnées par
|
<TBODY> |
(3.121) </TBODY> |
et
|
<TBODY> |
(3.122) </TBODY> |
Les
tétrades eam ont alors un double usage : composantes des vecteurs
de la base de coordonnées dans la base orthonormée et composantes des vecteurs
de la base orthonormée de formes mono-linéaires dans la base de coordonnées des
formes mono linéaires, tandis que l'inverse des tétrades sont les composantes
des vecteurs de la base orthonormée dans la base de coordonnées et les
composantes de la base de coordonnées des formes mono linéaires dans la base
orthonormée. Tout autre vecteur peut s'exprimer par ses composantes dans la
base orthonormée. Si un vecteur V
s'écrit Vm ê(m)
dans la base de coordonnées et Va
ê(a)dans la base
orthonormée , les ensembles de composantes satisfont à :
|
<TBODY> |
(3.123) </TBODY> |
Donc
les Tétrades nous permettent de passer des indices latins aux grecs et vice
versa. La propriété sympathique des tenseurs, qui est que compte tenu du
placement des index, il n'y a qu'une chose à peu près sensée que l'on puisse
faire nous est d'un grand secours ici. Nous pouvons donc enchaîner et appliquer
cela à des tenseurs sur leurs multiples index même mixtes.
|
<TBODY> |
(3.124) </TBODY> |
Retournant
à (3.118), nous voyons que les composantes du tenseur métrique dans la base
orthonormée sont précisément celles d'une métrique plate, hab
(pour cette raison on qualifie souvent les index grecs de courbe et les index
latins de plat) En fait rien ne nous empêche
d'élever ou abaisser les index latins en utilisant la métrique plate et
son inverse hab.
Vous pouvez vérifier que cela donne des résultats parfaitement corrects
(abaisser un index avec la métrique fait passer d'une base orthonormée à une
base de coordonnées).
En
particulier, notre définition des tétrades inverses est cohérente avec notre
notion habituelle d’élévation et d’abaissement d’indices.
eµa = gμνηabeνb (3.124-bis)
Nous
avons introduit les tétrades eνa comme composantes
d’un ensemble de vecteurs de bases, évalués dans une base différente. Ceci est
revient à les considérer comme les composantes d’un tenseur (1,1).
e = eνadxν
Ä ê(a) (3.124 ter)
Un
tenseur que nous connaissons et apprécions est le tenseur
« identité ». En appliquant ce tenseur sur un vecteur, nous obtenons
le même vecteur, dans une base différente. C’est ce que montre (3.123). De
même, si nous utilisons la tétrade inverse pour convertir un index latin de eνa,
en un index grec, conformément à (3.116), nous obtenons δμν
qui est l’application identité sur les vecteurs et 1-formes. Ce point mérite
d’être souligné, car nous pourrions choisir
d’interpréter eνa comme un ensemble de
composantes d’un vecteur (certains ouvrages le font), auquel cas la dérivée
covariante paraîtrait différente.
En
introduisant un nouvel ensemble de vecteurs de bases et de formes mono
linéaires, nous devons retourner à notre sujet favori, les propriétés de
transformation. Nous avons toujours prudemment déclaré que la loi de
transformation des tenseurs n'était qu'une conséquence indirecte des
transformations de coordonnées. Maintenant, nous avons une base non définie à
partir des coordonnées et cette base peut être changée indépendamment des
coordonnées, la seule contrainte (3.114) étant qu'elles soient et restent
orthonormées. Mais nous savons quelles transformations conservent la métrique
plate, dans une métrique Euclidienne à signature positive ce sont les
transformations orthogonales, tandis que dans une métrique à signature
Lorentzienne, ce sont les transformations de Lorentz. Nous considérons donc des
changements de base de la forme :
|
<TBODY> |
(3.125) </TBODY> |
Où
les matrices La'a(x)
représentent des transformations dépendantes de la position qui en chaque point
conservent la forme canonique de la métrique.
|
<TBODY> |
(3.126) </TBODY> |
En
fait ces matrices correspondent à ce que nous avons appelé en espace plats la
transformation inverse de Lorentz (qui opère sur les vecteurs de base), comme
avant nous avons aussi les transformations de Lorentz normales La'a, qui transforment une base de formes mono linéaires.
En termes de composantes, comme avant les index hauts sont transformés par La'a et les index bas
sont transformés par La'a.
Nous
avons donc la possibilité de réaliser une transformation de Lorentz (où une
simple rotation Euclidienne selon la signature) en chaque point de l'espace.
Ces transformations sont appelées en conséquence transformations locales de Lorentz
(LLT). Nous pouvons toujours changer de coordonnées, par des transformations générales de coordonnées (GCT).
Nous pouvons combiner ces deux opérations, le résultat étant un tenseur mixte
pour la loi de transformation.
|
<TBODY> |
(3.127) </TBODY> |
Transposer
notre connaissance sur les tenseurs dans des bases qui ne sont pas celles de
coordonnées, est principalement un exercice de manipulation de tétrades, en
respectant scrupuleusement les emplacements. L'exception cruciale concerne la
différentiation. Dans notre formalisme habituel, la dérivée covariante d'un
tenseur est formée de la dérivée partielle et de termes correctifs, un pour
chaque index invoquant le tenseur et les coefficients de connexion.
La
même procédure va s'appliquer pour des bases différentes de celles de
coordonnées, mais en remplaçant les coefficients de connexion habituels Glmn par une connexion
de spin notée wmab. Chaque index latin correspond à au facteur de
connexion de spin comme d'habitude.
|
<TBODY> |
(3.128) </TBODY> |
(Le
nom "connexion de spin" vient de ce qu'elle est utilisée pour prendre
les dérivées covariantes des spineurs, ce qui n'est pas possible avec les
coefficients de connexion habituels).
En
présence d'une combinaison de lettres latines et grecques, nous avons des
termes correctifs des deux types.
La
contrainte d'indépendance d'un tenseur vis à vis de sa représentation, nous
permet de dériver des relations entre la connexion de spin, les tétrades et les
G nml . Considérons la dérivée covariante d'un vecteur X, d'abord dans une base de coordonnées.
|
<TBODY> |
(3.129) </TBODY> |
Maintenant
intéressons- nous au même objet dans une base mixte et convertissons le dans la
base de coordonnées.
|
<TBODY> |
(3.130) </TBODY> |
La comparaison avec (3.129) révèle :
|
<TBODY> |
(3.131) </TBODY> |
Soit :
|
<TBODY> |
(3.132) </TBODY> |
En
triturant quelque peu l'expression, nous pouvons l'écrire sous forme
d'annulation de la dérivée covariante de la tétrade,
|
<TBODY> |
(3.133) </TBODY> |
Ceci
est quelquefois appelé le "postulat des tétrades". Remarquons que
ceci est toujours vrai, pas besoin de la moindre hypothèse sur la connexion
pour l'établir. En particulier la connexion n'a pas besoin d'être métrique et
sans torsion.
Comme
la connexion peut être interprétée comme quelque chose de nécessaire pour
rendre la loi de transformation de la dérivée covariante, il n'est pas
surprenant que la connexion de spin n'obéisse pas à la loi de transformation
des tenseurs. De fait, l'index bas grec se transforme correctement en
forme mono linéaire par la
transformation générale de coordonnées (GCT).
Mais
la connexion de spin se transforme de façon non homogène par la transformation
locale de Lorentz (LLT) selon
|
<TBODY> |
(3.134) </TBODY> |
Nous
vous invitons à vérifier que cela résulte de la transformation propre de la
dérivée covariante.
Pour
l'instant nous nous tenus à un formalisme abstrait, transposant ce que nous
savions dans une nouvelle notation. Mais ce travail nous apporte deux choses.
Le premier auquel nous avons déjà fait allusion, est la possibilité de décrire
des champs de spineurs dans l'espace-temps et d'en prendre la dérivée
covariante. Nous ne poursuivrons pas cette piste. La seconde est un changement
de point de vue sur les tenseurs permettant de les considérer comme des formes
différentielles valorisées tensoriellement
Par
exemple un objet comme Xma, que
nous décrivons comme un tenseur mixte de type (1, 1) peut aussi être représenté
par une "forme mono linéaire à valorisation tensorielle"(les
arguments de la forme sont des tenseurs). Il a un indice grec et nous pouvons y
voir une forme mono linéaire, mais il y a un vecteur qui correspond à chaque
valeur de l'indice. De même un tenseur Amnab, antisymétrique en m et
,
peut être interprété comme une forme bilinéaire valorisée par un tenseur(1, 1).
Alors,
un tenseur avec quelques indices grecs antisymétriques et quelques index latins
peut être interprété comme une forme différentielle, prenant ses valeurs dans
la partie tensorielle. D'habitude les formes différentielles sont valorisées
par des scalaires L'intérêt de ce point de vue est manifeste quand nous
considérons les dérivées extérieures. Si nous considérons Xma comme
une forme mono linéaire valorisée par des vecteurs, nous sommes tentés d'en prendre
la dérivée extérieure:
|
<TBODY> |
(3.135) </TBODY> |
Il
est facile de vérifier que cet objet se transforme comme une forme bilinéaire
(c.a.d selon la loi de transformation des tenseurs (0, 2) par
GCT's (transformation générale de coordonnées), mais pas comme un
vecteur par LLT's (les transformations de Lorentz dépendent de la position, ce
qui introduit un terme inhomogène dans la loi de transformation). Mais on peut
y remédier en utilisant judicieusement une connexion de spin qui joue le rôle
de forme mono linéaire, (pas une forme mono linéaire dont les arguments sont
des tenseurs du fait de la non tensorialité de la loi de transformation
(3.134).) Alors l'objet
|
<TBODY> |
(3.136) </TBODY> |
comme vous pouvez le
vérifier, se transforme comme un tenseur.
Une
application immédiate de ce formalisme est l'expression de la torsion et de la
courbure, les deux tenseurs qui caractérisent une connexion. La torsion, avec
ses deux indices antisymétriques peut être interprétée comme une forme
bilinéaire Tmna. dont
les arguments sont des vecteurs. La courbure, antisymétrique dans ses deux
derniers indices peut être interprétée comme une forme bilinéaire Rabmn, valorisée par
des tenseurs (1, 1).
Usant
de notre droit de supprimer des index, sur des formes différentielles, nous
pouvons écrire les relations définissant ces tenseurs par :
|
<TBODY> |
(3.137) </TBODY> |
et
|
<TBODY> |
(3.138) </TBODY> |
Elles
sont appelées les équations de structure de Maurer-Cartan.
Elles sont équivalentes aux définitions habituelles, faisons ensemble
l'exercice de le montrer pour la torsion, vous pourrez compléter de votre côté
pour la courbure. Nous avons :
|
<TBODY> |
(3.139) </TBODY> |
Ce
qui est juste la définition que nous avons donné. Ici nous avons utilisé
(3.131), l'expression pour les Glmn en termes de tétrades et de connexion de spin. Nous pouvons aussi exprimer que ces
tenseurs satisfont aux identités :
|
<TBODY> |
(3.140) </TBODY> |
et
|
<TBODY> |
(3.141) </TBODY> |
La
première est la généralisation de Rr [smn] = 0,
tandis que la seconde est l'identité de Bianchi Ñ[l½Rrs|mn] = 0.
(Quelquefois, les deux équations sont appelées l'identité de Bianchi).
La
forme de ces expressions nous pousse irrésistiblement à la tentation de définir
une "dérivée extérieure covariante", qui agit sur une forme linéaire
à valorisation tensorielle en prenant la dérivée extérieure classique et qui
ajoute les termes appropriés de connexion de spin, pour chaque index latin.
Bien que nous ne le fassions pas ici, céder à cette tentation serait fondé, et,
en fait, le membre de droite de (3.137) et les membres de gauche de (3.140) et
(3.141) peuvent être interprétées justement comme des dérivées extérieures
covariantes. Mais soyons prudents, comme (3.138) ne le peut pas, vous ne pouvez
pas prendre une quelconque dérivée covariante d'une connexion de spin, car ce
n'est pas tenseur..
Puisque
nos équations sont vraies pour des connexions générales, regardons ce que nous
obtenons pour une connexion de Christoffel. La contrainte d'absence de torsion
se traduit par l'annulation de (3.137), Ceci ne conduit pas immédiatement à une
conclusion simple sur les coefficients de la connexion de spin. La
compatibilité métrique s'exprime par la nullité de la dérivée covariante de la
métrique :
g = 0. Nous voyons à quoi cela conduit
quand nous exprimons la métrique dans la base orthonormée, où ses composantes
sont simplement hab:
|
<TBODY> |
|
||
|
|
(3.142) </TBODY> |
|
Poser ceci égal à zéro
implique :
|
<TBODY> |
(3.143) </TBODY> |
Alors,
la compatibilité métrique implique l'antisymétrie de la connexion de spin dans
ses indices latins (rappelons qu'une telle condition n'a un sens que si les
deux index sont soit hauts soit bas ensembles). Ces deux conditions ensemble
nous permettent d'exprimer la connexion de spin en termes de tétrades. Il y a
une formule explicite pour cela, mais en pratique, le plus simple c'est de
résoudre la condition de torsion nulle.
|
<TBODY> |
(3.144) </TBODY> |
Et
en utilisant l'antisymétrie de la connexion de spin, de trouver les composantes
individuelles.
Nous
avons maintenant le formalisme nous permettant de comparer les connexions et la
courbure en géométrie de Riemann avec celle des théories de jauge en physique
des particules. C'est une digression, compréhensible par tous, mais non
essentielle dans le cours de RG.
Dans
ce cas, les champs qui nous intéressent sont décrits dans des espaces
vectoriels définis en chaque point de l'espace-temps. D'une part, en géométrie
de Riemann, les espaces vectoriels incluent les espaces tangents, cotangents et
des espaces tensoriels d'ordre supérieur construits à partir d'eux. D'autre
part, dans les théories de jauge nous nous intéressons aux espaces vectoriels
"internes".
La
différence est que les espaces tangents et ses associés sont intimement associés à la variété et sont
naturellement définis quand la variété l'est, alors que les espaces internes
peuvent être de n'importe quelle dimension et sont ajoutés indépendamment de la
variété.
Faisceau de fibres
En
jargon mathématique, l'union de la variété de base et d'espaces vectoriels
internes (définis en chaque point) s'appelle un faisceau de fibres, et chaque copie d'un espace vectoriel est
appelé la fibre (en accord avec notre définition du faisceau tangent).
A
côté de la variété de base, (pour nous l'espace-temps) et les fibres, l'élément
important dans la définition d'un faisceau de fibres est la "structure de
groupe", un groupe de Lie qui s'applique sur les fibres pour décrire
comment elles sont assemblées et réunifiées sur leurs recouvrements.
Sans
rentrer dans les détails, le groupe de structure pour le faisceau tangent dans
un espace-temps à quatre dimensions, est GL (4,
),
le groupe de matrices 4 × 4 inversibles, et si nous avons une métrique Lorentzienne
il peut se réduire au groupe de Lorentz SO(3, 1).
Considérons
un espace vectoriel tridimensionnel et combinons les fibres avec les rotations
classiques, la structure de groupe de ce nouveau faisceau est alors SO(3).
Un
champ supporté par ce faisceau peut être noté FA (xm), où A vaut de un à trois, c'est un vecteur
tridimensionnel (interne et non référencé à l'espace-temps) en chaque point de
la variété. Nous pouvons choisir librement la base dans les fibres, ce qui
signifie que les grandeurs physiques doivent être conservées sous des
transformations locales
SO(3)
comme décrit ci-dessous :
|
<TBODY> |
(3.145) </TBODY> |
Où OA'A(xm) est une matrice de SO(3) qui dépend de
l'espace-temps.
De
telles transformations sont appelées transformations
de jauge, et les théories invariantes par elles sont appelées " théories de jauge."
Il n'est pas difficile, pour la plus grande partie, d'arranger les choses pour que les grandeurs physiques soient conservées par des transformations de jauge. La seule difficulté concerne la dérivée partielle ¶mF