Portail de François Jortay

jortay.net

Savoir de base

email Facebook Twitter
Màj : 18 jan. 2021   –   # pages : 129 [?]

Introduction

https://jortay.net/savoir-de-base#intro
savoir-de-base.png

"Savoir de base" présente des synthèses écrites (et illustrées) des exceptionnelles vidéos de clipedia.be, réalisées par une équipe dirigée par Marc Haelterman, professeur à l'École polytechnique de l'Université libre de Bruxelles (NB : je suis seul responsable des éventuelles erreurs que contiendraient ces synthèses).

Vidéos et synthèses écrites sont idéalement complémentaires, les dernières facilitant notamment la révision des premières. Mais "Savoir de base" ajoute une autre plus-value (ou complémentarité) : la numérotation des sections et des définitions/équations :

  • la présentation numérotée des sections le long d'un "fil rouge"reflétant le développement scientifique historique et logique (mathématique et physique précédant chimie et biologie) ;
  • à cette numérotation des sections s'ajoute une double numérotation des définitions et équations :
    • numérotation rouge : première apparition de l'équation (⇒ présentée avec sa démonstration) ;
    • numérotation bleue : renvoi (lien hypertexte) vers la numérotation rouge (un numéro rouge se situant généralement en amont du ou des correspondants bleus renvoyant vers lui).
Vidéos

Les titres de section et leur nombre ne correspondent pas exactement aux vidéos Clipédia. Chaque vidéo est mentionnée par son titre, sous forme de lien hypertexte (renvoyant vers la video sur clipédia.be) au début de la section qui en synthétise le contenu. Donc pour retrouver ici une vidéo : CTRL+F (Mac : commande+F) ⇒ "Titre de la vidéo".

Examen

Si tu prépares l'examen d'entrée en École polytechnique ou faculté de médecine, ce document est fait pour toi ! Mais pour réussir ces examens il te faudra également t'exercer à la résolution de problèmes (en voici quelques-uns : clipedia.be/quiz).

Compréhension intuitive. L'approche des vidéos de clipedia.be n'est pas celle de la rigueur mathématique des développements, mais plutôt ce qu'on appelle de façon imagée "faire des maths avec les mains". Ce que l'on perd en rigueur mathématique, on le gagne cependant en compréhension intuitive. Il s'agit donc de travailler surtout l'interprétation physique des phénomènes ou techniques étudiés, plutôt que leur développement et formulation mathématiquement rigoureux. Les deux approches – pragmatisme physique et rigueur mathématique – sont donc utilement complémentaires.

Philosophie

"Savoir de base", titre du présent document, constitue un des trois principes de base de notre philosophie du savoir :

  1. parcours de vie ;
  2. R&D libre ;
  3. savoir de base.

La philosophie et la science traitent du savoir : la première s'intéresse au savoir pourquoi, la seconde au savoir comment.

Cependant la frontière entre ces deux approches n'est pas nette, il y des incursions, par le biais de différentes formes de langages. La linguistique semble plus adaptée à la philosophie (quoique ...) tandis que les scientifiques préfèrent souvent (mais pas toujours) les mathématiques et l'informatique.

Le schéma suivant propose une synthèse de la relation historique et logique entre ces notions.

Mesure

https://jortay.net/savoir-de-base#mesure

La mesure des phénomènes étudiés est le premier pas de la démarche scientifique.

 2.1. Unités de mesures
 2.2. Puissance et exposant
 2.3. Logarithme
 2.4. Numération de position

Unités de mesures

https://jortay.net/savoir-de-base#unites-mesure

Convention d'écriture. Avant d'entrer dans le vif du sujet, petit rappel concernant l'usage des parenthèses avec l'opérateur de division :
2 / 2 / 2 =
( 2 / 2 ) / 2 =
1 / 2 =
0,5
Mais :
2 / 2 / 2 ≠
2 / ( 2 / 2 ) =
2 / 1 =
2

Ce problème ne se pose pas pour la multiplication :
2 * 2 * 2 = ( 2 * 2 ) * 2 = 4 * 2 = 8
2 * 2 * 2 = 2 * ( 2 * 2 ) = 2 * 4 = 8

La raison en est que le produit est commutatif, alors que la division ne l'est pas :
4 / 2 = 2
2 / 4 = 0,5

triangle-clipedia.png Vidéo Clipedia : Changements d'unités

Entrons maintenant dans le vif du sujet. Un point fondamental est que les notations d'unité peuvent être traitées comme des nombres.

Surfaces

Ainsi pour l'unité de surface (x*y) en mètres (m) :
S = x m * y m = x * y m m = x * y m2

Supposons maintenant qu'on veuille calculer le nombre N de briques de surface latérale de 75 cm2 nécessaire pour construire un mur de 3 m2 :
N = 3 m2 / ( 75 cm2 ) =
ces parenthèses ne s'imposent pas ici car l'unité de mesure est nécessairement attachée au nombre qui la précède :
3 m2 / 75 cm2 =
3 m m / 75 cm2 =
3 * 100 cm * 100 cm / 75 cm2 =
3 * 10.000 cm cm / 75 cm2 =
3 * 10.000 cm2 / 75 cm2 =
les unités de mesure au numérateur et dénominateur s'annulent comme des nombres :
30.000 / 75 = 400

Ce nombre de brique est dit "sans dimension" : aucune unité de mesure ne lui est associée.

Vitesse

Passons maintenant aux unités composées. Quelle est la vitesse moyenne en km/h atteinte par le recordman du monde du 100 mètres (9s58, Usain Bolt, 2009) ?

v = 100 m / 9,58 s
or 1 km = 1000 m ⇔ 1 m = 1 / 1000 km
et 1 h = 60 m = 60 * 60 s = 3600 s ⇔ 1 s = 1 / 3600 h    ⇒

v = 100 * 1 / 1000 km / ( 9,58 * 1 / 3600 h )    ⇔
v = 100 / 1000 / 9,58 * 3600 km/h = 37,6 km/h

N.B. Il s'agit là de la vitesse moyenne. Or la vitesse de départ est de zéro ⇒ il y a une accélération conduisant à une vitesse maximale vers la fin de course. Cette vitesse de pointe atteinte par Bolt fut d'environ 45 km/h. L'antilope et le guépard peuvent atteindre une vitesse de pointe d'environ 95 km/h [source].

Température

Le passage des mesures de température entre degrés Celsius et Fahrenheit se fait selon l'équation T C = ( T F - 32 ) / 1,8.

triangle-clipedia.png Vidéo Clipedia : Le radian
radian.png

Angles

Radian. Par définition α = a radians ⇔ arc(α) = a * R (en unités de longueur de R) .

En particulier α = 1 radian ⇔ arc(α) = R : exprimer l'angle α en radians (rad) c'est donc l'exprimer par rapport à une unité correspondant à une longueur d'arc égale au rayon R.

Degré. Le degré est défini par rapport au radian et au nombre π ("Pi"). Soit C la circonférence d'un cercle de rayon R :
π = C / R / 2
⇔ C = 2 * π * R
⇒ par définition du dégré :
360 deg = 2 * π  rad    ⇔
deg = π / 180  rad    ⇔
1  rad = 180 / π  deg ≈    ⇔
1  rad = 180 / 3,1416  deg = 57,3 °

Le tableau suivant résume les développements ci-dessus sous forme de règles de trois.

RADARCDEG
θθ * R?
2 * π2 * π * R360
1R90 / π * 2 * R
1R=1180 / π ≈ 180 / 3,1416 = 57,3

Un intérêt du radian, en liant toute grandeur d'angle à une longueur d'arc correspondante (pour un R déterminé *), est de faciliter la mesure des angles : on mesure la longueur de l'arc ⇒ on en déduit la taille de l'angle en degrés (alors que pour mesurer directement en degré il faut utiliser un rapporteur).

(*) Mais dans le cercle trigonométrique on suppose toujours R=1

Puissance et exposant

https://jortay.net/savoir-de-base#puissance-exposant

L'expression a2 se lit "a exposant 2" ou encore "a puissance 2". Mais elle se lit aussi "a carré" car a2 est la surface d'un carré de côté de longueur a. De même a3 se lit "a exposant 3" ou encore "a puissance 3". Mais elle se lit aussi "a cube" car a3 est la surface d'un cube d'arrête a.

La notion de puissance est illustrée dans nombre d'applications du monde physique :

  • au 19° siècle Ludwig Boltzmann a démontré que tout corps chauffé émet de la lumière dont l'intensité est proportionnelle à la puissance quatre de sa température : I = c * T 4 exprimant ainsi une forte sensibilité de l'intensité lumineuse par rapport à la température du corps : quand on double la température l'intensité est multipliée par 24=16.
  • au 17° siècle Isaac Newton a montré que la lune est attirée par la Terre par une force (dite "gravitationnelle") proportionnelle à l'inverse du carré de la distance séparant les deux astres : F = C / d 2 : si cette distance doublait cette force diminuerait d'un facteur 1/22=1/4.
  • la notation exponentielle (ou "scientifique") permet également d'exprimer simplement des grandeurs très élevées, telles que la vitesse de la lumière :
    c = 300.000.000 m/s    ⇔
    c = 3 * 100.000.000 m/s    ⇔
    c = 3 * 108 m/s

Règles de calcul :

  • produit de puissances :
    π n ( a pi ) = a n pi
    Exemple : ( a u * a v ) = a u+v
    Démonstration :
    π n ( a pi ) =
    π n ( π pi a) =
    π p1 a * ... * π pn a =
    a n pi
    CQFD
    P.S. On peut alors démontrer que a 0 = 1 (sauf si a=0, dans lequel cas il y a indétermination) :
    a m * a 0 = a (m+0)    ⇔
    a m * a 0 = a m    ⇔
    a 0 = 1
    CQFD
  • puissance de produit :
    ( π a ) n = π ( a n )
    Exemple : ( x * y ) n = x n * y n
    Démonstration :
    ( π a ) n =
    par définition de l'exposant
    π n ( π a ) =
    par commutativité du produit
    π ( π n  a ) =
    π ( a n )
    CQFD
  • puissance de puissance :
    ( a m ) n = a m*n
    Démonstration :
    ( a m ) n =
    π n ( a m ) =
    par n_produit-de-puissances :
    a n m =
    a m*n
    CQFD
  • quotient de puissance :
    a m / a n = a m - n
    Démonstration :
    a m / a n =
    π m ( a ) / π n ( a ) =
    π m-n ( a ) =
    a m - n
    CQFD
    Ce qui permet d'introduire la notion d'exposant négatif en posant m=0 dans n_quotient-de-puissance :
    a 0 / a n = a 0 - n    ⇒
    par n_exposant-zero :
    1 / a n = a - n qui est donc la définition de a-n.

Logarithme

https://jortay.net/savoir-de-base#logarithme
triangle-clipedia.png Vidéo Clipedia : Les logarithmes : introduction
Définition

La notion de logarithme repose sur la fonction exponentielle y (x) = b x ou b est appelé "base de la fonction exponentielle". La "fonction logarithmique en base b" est alors simplement logb (y) = x. La définition du logarithme est donc (en simplifiant y (x) par y) :
y = b x   ⇔   logb (y) = x

  • L'opération de gauche à droite est appelée "passage au logarithme".
  • Par convention lorsque b=10 on ne mentionne pas la base : log x = log10 x

Autrement dit (en lisant l'équivalence de droite à gauche) : le logarithme en base b (logb) d'un nombre y est la puissance en base b qui donne ce nombre y.

Fonctions réciproques. Les fonctions logarithme log(x) et exponentielle exp(x) sont réciproques, c-à-d que log( exp(x) )= exp( log(x) ) = x : (7)

  • exp( log(x) ) = x : en substituant la valeur de x du membre de droite de l'équivalence n_log-def-longue dans le membre de gauche ⇒ y = b logb (y) ;
  • log( exp(x) ) = x : en substituant la valeur de y du membre de gauche de l'équivalence n_log-def-longue dans le membre de droite ⇒ logb ( b x ) = x.
Applications

On va montrer l'utilité du logarithme pour (i) rendre possible la comparaison de mesures d'ordres de grandeurs très différentes ; (ii) faciliter le calcul du produit de grand nombres ; mesurer la perception auditive.

Ordre de grandeurs. Dans l'échelle de mesure suivante, dont l'unité est le mètre, on peut comparer un humain et un cétacé, mais on ne peut distinguer les corps d'ordres de grandeur inférieurs au mètre, ni mesurer ceux d'un ordre de grandeur dépassant la largeur de l'écran (ici un séquoia).

echelle-non-log.png

Pour résoudre ce problème il suffit de passer à la notation scientifique (ou notation exponentielle) des ordres de grandeur :

virus~ 0,1 µm10- 7 m
bactérie~10 µm10- 5 m
fourmi~ 1 mm10-3 m
souris~ 1 cm10-2 m
humain~ 1 m100 m
cétacé~ 10 m101 m
séquia~ 100 m102 m

Il suffit alors d'utiliser les exposants pour graduer l'échelle dite "logarithmique". L'unité de cette échelle correspond à un rapport ("logos") constant de valeur b=10 : 10 - (n-1) / 10 - n = 10 (alors que l'échelle précédente correspond à un rapport n / n - 1, qui n'est pas constant).

echelle-log.png

Cette échelle fait bien appel à la notion de log. Ainsi prenons le cas de la fourmi : log(1mm)=log(0,001m)=-3 car 0,01=10-3.

Simplification de calculs. La notion de logarithme a été développée au 17° siècle par John Napier pour faciliter les calculs impliquant des grands nombres (exemple : 3.5478.341 * 6.148.632). Cette technique de simplification exploite la propriété π n ( a ei ) = a n ei n_produit-de-puissances :

Soit 3.5478.341 = A et 6.148.632 = B    ⇒ par n_produit-de-puissances :
log ( A * B ) = log (A) + log (B)    ⇒
pour calculer A * B il suffit de :
1. chercher log(A) et log (B) dans la table des logarithmes
2. calculer log (A) + log (B)     ⇒ on connaît log ( A * B )     ⇒
3. chercher log ( A * B ) dans la table de logarithmes
4. on trouve A * B à la même ligne de la colonne adjacente.
CQFT

triangle-clipedia.png Vidéo Clipedia : Le logarithme et l’audition

Perception auditive. L'échelle logarithmique correspond à divers phénomènes naturels tels que l'audition. L'oreille humaine moyenne peut percevoir des intensités sonores comprises entre 10-12 W/m2 (noté I0 et appelé "seuil d'audibilité) et 1 W/m2 (appelé "seuil de dommage" : au-delà l'intensité commence à provoquer des lésions).

Mais l'intensité perçue par l'oreille humaine ne répond pas à la même dynamique que l'intensité mesurée par un appareil de mesure (microphone + sonomètre). Ainsi le graphique suivant montre que si la puissance de la source sonore est doublée la perception de cette variation par l'oreille est inférieure à ce facteur 2, et en outre cet effet d'amortissement (ou plutôt de saturation) augmente avec le niveau de puissance de la source. Le graphique suivant exprime cela de façon inverse : pour doubler la perception d'un son par l'oreille humaine il faut multiplier la source par un facteur croissant. Il apparaît que cette croissance est exponentielle : pour augmenter la perception de n à 2n la source doit augmenter de 10n (exemple : pour que la perception passe de 4 à 8 la source doit augmenter de 104.

echelle-sonore.png

Le zéro est placé à I0 et l'unité est fixée arbitrairement à 10 * I0.

On peut alors concevoir une unité sonore spécifique à l'oreille humaine pour obtenir une échelle mesurant l'intensité perçue par l'oreille humaine. Pour ce faire on opère en deux phases :

  1. Dans la seconde règle du graphique ci-dessous on exprime l'intensité sonore I en x unités du seuil d'audibilité I0 : I = x * I0 = x * 10-12 W/m2 :
    echelle-auditive.png

    Notez les unités différentes (à droite en vert).

  2. Dans ces conditions y = log x traduit le fait que l'intensité sonore perçue (y) répond de façon logarithmique à l'intensité sonore mesurée (x). L'unité de y est appelée "bel" (en hommage à Graham Bell), mais en pratique on utilise plutôt le dB : y = 10 log x [dB].

    echelle-auditive-dB.png

Comparons les intensités sonore de la voiture (V) et de la moto (M) :
40 = 10 (log xV)
80 = 10 (log xM)


xV = 10 4
xM = 10 8

⇒ par n_quotient-de-puissance :
xM / xV = 10 4
Interprétation : alors que la puissance sonore mesurée du moteur de moto est 10.000 fois supérieur à celle de la voiture nous ne percevons qu'une différence par un facteur 80/40=2 (PS : quant à la différence, perçue ou mesurée, entre voiture et moto, c'est grâce à la longueur plus grande de son pot d'échappement que la voiture amortit mieux la pression acoustique émise par les pistons du moteur à explosion).

triangle-clipedia.png Vidéo Clipedia : La fonction logarithme
Propriétés

Si dans l'équivalence y = b x   ⇔   logb (y) = x n_log-def-longue on substitue la valeur de y du membre de gauche de dans le membre de droite, on obtient que :
logb b x = x
c-à-d que le logarithme de l'exponentielle, c'est la fonction identité.

Et si dans cette même équivalence y = b x   ⇔   logb (y) = x n_log-def-longue on applique la fonction exponentielle à l'égalité de droite, alors on en déduit, par comparaison avec l'égalité de gauche, que :
b logb y = y
c-à-d que l'exponentielle du logarithme, c'est aussi la fonction identité.

Logarithme et exponentielle sont donc des fonctions réciproques.

graphe-exp-log.jpg

On obtient le graphe de la fonction log à partir de la fonction exp par deux rotations : 90° à sens horaire, puis 180° de bas en haut.

Les nombres négatifs ne font pas partie du domaine de la fonction log (exemple : -3 = 10 ?).

Quelques valeurs remarquables :
logb 0 = - ∞car0 = b - ∞
logb 1 = 0car1 = b 0
logb ∞ = car∞ = b

Règles de calcul :

  • logarithme d'un produit :
    En remplaçant pi par logb(pi) dans π n b pi = b n pi n_produit-de-puissances    ⇒ par n_exp-de-log
    π n b logb pi = b n logb pi    ⇔
    par n_exp-de-log :
    π n pi = b n logb pi    ⇔
    log π n pi = log ( b n logb pi )    ⇔
    par n_exp-log-reciproques :
    logb π n pi = ∑ n logb pi
  • logarithme d'une puissance :
    en remplaçant m par logba dans ( b m ) n = b m*n n_puissance-de-puissance     ⇒
    ( b logb a ) n = b n * logb a     ⇔
    a n = b n * logb a     ⇔
    logb a n = n * logb a     ⇔
  • logarithme d'un quotient :
    en remplaçant m par logbm et n par logbn dans a m / a n = a m - n n_quotient-de-puissance     ⇒
    a logb m / a logb n = a logb m - logb n    ⇔
    m / n = a logb m - logb n    ⇔
    log ( m / n ) = logb m - logb n
  • Soit
    x = a loga x     ⇒
    b = a loga b
    substitué dans :
    x = b logb x     ⇒
    x = ( a loga b ) logb x     ⇔
    x = a loga b * logb x     ⇒
    égalité entre les membres de droite des 1° et 5° égalités ⇒
    loga x = loga b * logb x
    En particulier si x=a ⇒
    loga a = loga b * logb a
    1 = loga b * logb a     ⇔
    loga b = 1 / logb a

Enfin on notera que dans la pratique ce sont essentiellement trois bases qui sont utilisées : 10, 2 (notamment en informatique) et e=2,718281... (où loge est noté ln et appelé logarithme népérien en honneur à John Napier).

Numération de position

https://jortay.net/savoir-de-base#numeration-de-position
triangle-clipedia.png Vidéo Clipedia : Numération de position
# unités / paquetbn...b2b1b0
# max. de paquetsb-1b-1b-1b-1b-1

Le tableau suivant calcule 185 en base b=7 (exprimé avec les symboles de la numérotation décimale : 0, 1 ,2, ...,9) : 185 < 343 ⇒ le nombre commence en colonne b2 : dans 185 je peux mettre 185/49=3,8 paquets de 49 ⇒ 3 en b2 ⇒ restent 185-3*49=38. On passe en b1 : dans 38 je peux mettre 38/7=5,4 paquets de 7 ⇒ 5 en b1 ⇒ restent 38-5*7=3 ⇒ 3 en b1 ⇒ 1857=353 [vérifier].

b3b2b1b0
3434971
353

Le tableau suivant calcule 40 en base b=2 (exprimé avec les symboles de la numérotation décimale : 0, 1 ,2, ...,9) : 40 < 64 ⇒ le nombre commence en colonne b5 : dans 40 je peux mettre 40/32=1,25 paquets de 32 ⇒ 1 en b5 ⇒ restent 40-1*32=8. En b4 on a 16 > 8 ⇒ 0 en b4. En b3 on a 8 qui comble exactement le reste de 8 ⇒ 1 en b3 ⇒ 402=101000 [vérifier].

b6b5b4b3b2b1b0
6432168421
101000

Géométrie

https://jortay.net/savoir-de-base#geometrie

La géométrie, art de la mesure, corps des nombres.

 3.1. Trigonométrie
 3.2. Vecteur
 3.3. Équation de la droite
 3.4. Produit vectoriel
 3.5. Équation du second degré

Trigonométrie

https://jortay.net/savoir-de-base#trigonometrie
triangle-clipedia.png Vidéo Clipedia : Somme des angles du triangle
somme-angles-triangle.png

La somme des angles d'un triangle quelconque vaut 180° ou π rad.
Pour le démontrer géométriquement, il suffit de translater le triangle (c-à-d le déplacer parallèlement à lui-même) pour placer sa copie de sorte que les angles a du triangle supérieur et c du triangle inférieur forment 180° avec l'angle qui les séparent. Or celui est nécessairement le troisième angle b puisque le triangle a été déplacé parallèlement à lui-même.

Autre démonstration. La somme des angles d'un rectangle vaut 4*90°=360° ⇒ la somme des angles de chacun des deux triangles dessinés par la diagonale représente 360°/2=180°. Or ce résultat est inchangé si l'on transforme ce rectangle en parallélogramme de même surface, et les deux triangles rectangles deviennent ainsi quelconques.

triangle-clipedia.png Vidéo Clipedia : Théorème de Pythagore
trigonometrie.png

Théorème de Pythagore : dans un triangle rectangle :
R2 = x2 + y2 .

Nous en verrons une démonstration mathématique dans la section consacrée au produit scalaire [n_pythagore-math]. Mais on peut d'ors et déjà en faire une démonstration géométrique.


La démonstration géométrique suivante (cf. graphique ci-dessous) consiste en trois étapes :

  1. la rotation de l'hypoténuse R correspondant aux surfaces x2 et y2 génère la surface R2;
  2. la surface R2 pivote autour du même point pour inscrire son côté supérieur dans la surface y2;
  3. les trois surfaces à l'extérieur de R2 remplissent exactement les deux surfaces vides à l'intérieur de R2 ⇔ la surface R2 égale la somme des surface x2 et y2. CQFD.
pythagore.png
triangle-clipedia.png Vidéo Clipedia : La fonction sinus
sin-cos.png

Définition (⇒ ne se démontre pas) : dans un triangle rectangle le sinus d'un angle est le rapport entre son côté opposé et l'hypoténuse :
sin(a) ≡ y / R
y = R * sin(a) : y est la projection de R par sin(a)
R = y / sin(a) : R est la projection de y par 1/sin(a)

triangle-clipedia.png Vidéo Clipedia : La fonction cosinus

Définition : dans un triangle rectangle le cosinus d'un angle est le rapport entre son côté adjacent (c-à-d celui qui le relie à l'angle droit) et l'hypoténuse :
cos(a) ≡ x / R
x = R * cos(a) : x est la projection de R par cos(a)
R = x / cos(a) : R est la projection de x par 1/cos(a)

Par n_sinus et n_cos(a)=x/R :
cos(a) = sin (b)    ⇒
par n_somme-angles-triangle :
cos(a) = sin (90-a)    ⇔
sin(a) = cos(90-a)

Loi de projection. On peut alors généraliser en disant que :

  • tout côté adjacent de l'hypoténuse est la projection de celle-ci : soit par le cosinus de l'angle qu'il forme avec elle, soit par le sinus de l'angle opposé ;
  • l'hypoténuse est la projection de chacun des autres côtés : soit par l'inverse du cosinus de l'angle qu'il forme avec lui , soit par l'inverse du sinus de l'angle opposé.
triangle-clipedia.png Vidéo Clipedia : La loi des sinus
loi-sinus.png

Loi des sinus : dans un triangle quelconque le rapport entre le sinus d'un angle et son côté opposé est identique pour les trois angles ⇒
sin(α) / a = sin(β) / b = sin(γ) / c .
Démonstration par n_projection1 :
H = c * sin(β) = b * sin(γ) ⇔
H = c / sin(γ) = b / sin(β) ⇒
même principe en prenant un autre côté commé référentiel ⇒ CQFD.

Par n_sinus et n_cos(a)=x/R substitués dans n_pythagore :
sin2(a) + cos2(a) = 1

tangente.png

Définition : dans un triangle rectangle la tangente d'un angle α (exprimé en radians) est le rapport entre sin(α) et cos(α) :
tan(α) ≡ sin(α) / cos(α)
ou encore entre ses côtés opposé (y) et adjacent (x) :
tan(α) = y / x :
tan(α) est la pente de l'hypoténuse
y = x * tan(α) : y est la projection de x par tan(α)
x = y / tan(α) : x est la projection de y par 1/tan(α)

Propriétés visuelles remarquables :
• si α petit ⇒ sin(α) ≈ α et cos(α) ≈ 1 tg(α) ≈ α
⇔ la droite de longueur tg(α) et la courbe de longueur α se confondent.

La fonction tan() est particulière :

  1. à l'instar des fonction sin() et cos() elle est périodique, leur période étant de π radians ⇒
    tan(α) = tan(π-α) = - tan(α - π)
    de par la seconde égalité la fonction tangente est dite "anti-symétrique" exemple : tan(225°) = tan(225°-180°) = tan(45°) = 1
  2. mais les sommets de la fonction tan() sont à l'infini.
Mplwp sin cos tan piaxis
sin(a+b).png

Addition : soient a et b deux angles quelconques dans le cercle trigonométrique de rayon 1 :

  • sin(a+b) = sin(a) * cos(b) + cos(a) * sin(b)
  • cos(a+b) = cos(a) * cos(b) - sin(a) * sin(b)

Pour démontrer sin(a+b) on détermine un référentiel pour l'angle b, obtenu par rotation du référentiel de a par la valeur de a. On va alors projeter sin(b) et cos(b) sur l'axe des sinus dans le référentiel de a :
(i) le segment rouge continu est la projection du rayon R=1 par cos(b) c-à-d cos(b) ⇒ par n_cos(a)=sin(90-a) sa projection sur le segment rouge hachuré vaut sin(a) * cos(b) ;
(ii) le segment bleu hachuré (translaté à droite) est la projection de sin(b) par cos(a) c-à-d cos(a) * sin(b) (PS : c'est bien l'angle a que l'on retrouve là car ses côtés sont perpendiculaires à ceux de a originel).

Nous verrons plus loin dans le cours que l'on peut démontrer ces propriétés algébriquement, plus simplement, en faisant appel à la fonction exponentielle.

Un cas particulier de n_cos(a+b) est :
cos(2a) = cos2(a) - sin2(a)
or sin2(a) + cos2(a) = 1 n_sin2(a)+cos2(a)=1    ⇒
cos(2a) = 2 * cos2(a) - 1
cos(2a) = 1- 2 * sin2(a)

cos(a+b).png

Même principe pour démontrer cos(a+b), mais cette fois ci on va projeter sin(b) et cos(b) sur l'axe des cosinus dans le référentiel de a :
(i) le segment fléché en violet est la projection de R=1 par cos(a+b);
(ii) le segment fléché en rouge est la projection de cos(b) par cos(a);
(iii) le segment fléché en bleu est la projection de sin(b) par sin(a) (PS : c'est bien l'angle a que l'on retrouve là car ses côtés sont perpendiculaires à ceux de a originel);
(iv) on voit alors que le segment violet vaut le rouge moins le bleu.

Et en remplaçant b par -b on trouve facilement que :

  • sin(a-b) = sin(a) * cos(b) - cos(a) * sin(b)
  • cos(a-b) = cos(a) * cos(b) + sin(a) * sin(b)
30-45-degres.png

Pour résoudre de nombreux calculs il est utile de connaître le sin et cos des "angles clés" que sont 30° et 45°.

Si a=30° alors son symétrique par rapport à l'axe X forme avec a un angle de 60° ⇒ comme il y a symétrie chacun des deux autres angles vaut donc (180-60)/2=60° ⇒ le triangle est équilatéral ⇒ les trois côtés valent 1 ⇒
sin(30) = 1/2
⇒ par n_sin2(a)+cos2(a)=1 : 1/4 + cos2(30) = 1 ⇒
cos(30) = √3 / 2

Si a=45° alors par symétrie sin(45)=cos(45) ⇒ par n_sin2(a)+cos2(a)=1 :
sin(45) = cos(45) = 1 / √2

Vecteur

https://jortay.net/savoir-de-base#vecteur
 3.2.1. Définition
 3.2.2. Norme et addition
 3.2.3. Produit scalaire
Définition
https://jortay.net/savoir-de-base#vecteur-definition

Un vecteur est défini par une origine, une longueur (norme≈module), une direction et un sens (signe). Un vecteur peut être placé à différent endroits de l'espace par translation. Par conséquent on peut le placer à l'origine x=y=0 de son référentiel de sorte que le vecteur a est entièrement défini par ses coordonnées (ax, ay) ce qui a notamment pour effet de simplifier les calculs.

vecteur-translation.png
Norme et addition
https://jortay.net/savoir-de-base#vecteur-norme-addition
triangle-clipedia.png Vidéo Clipedia : La norme d'un vecteur

La norme est une grandeur mathématique (sans dimension c-à-d sans unité) tandis que le module est une grandeur physique (avec unité, par exemple le Newton). Le module de a se note et se calcule comme suit : || a|| = √(ax2 + ay2) n_pythagore. Par convention on écrit souvent simplement a au lieu de || a|| .

Addition

Pour additionner deux vecteurs a et (-)b on peut procéder géométriquement ou mathématiquement :

  • géométriquement : on place, par translation, l'origine de (-)b à l'extrémité de a
    • a + (-)b est le vecteur allant de l'origine de a à l'extrémité de (-)b
    • a - b est aussi le vecteur allant de l'extrémité de b à celle de a
      ⇔ on a bien que b + (a - b) = a
  • mathématiquement : a + b = (ax, ay) + (bx, by) = ( ax + bx , ay + by )
vecteur-soustraction.png

L'addition vectorielle permet de montrer que : a = ( ax , ay ) = ax * 1x + ay * 1y1x est le vecteur unitaire, qui est tel que 1x = x / || x || (PS : ceci montrant bien que l'on peut accorder aux unités des axes des longueurs arbitraires, éventuellement différentes).

Produit scalaire
https://jortay.net/savoir-de-base#vecteur-produit-scalaire
triangle-clipedia.png Vidéo Clipedia : Le produit scalaire
produit-scalaire-physique.jpg

Application. L'image ci-contre illustre que pour amener la masse au sommet de la pente L ce n'est pas la force F qu'il faut contrer mais celle-ci diminuée par l'aide apportée par cet "outil" qu'est la pente : plus cette pente est faible (c-à-d plus θ est grand) plus l'aide de force est grande (mais le trajet aussi, de sorte que, comme nous verrons supra, le travail effectué W = f * L n_travail est identique). Le vecteur A de cette aide est perpendiculaire à la pente, dont la structure empêche la masse de passer au travers d'elle. Or si on applique le principe de soustraction vectorielle F - A c-à-d "le vecteur allant de l'extrémité de A à celle de F" n_scalaires-additions, on obtient bien le vecteur parallèle à la vente et dirigé vers le bas (f). Sa force opposée, donc orientée vers le haut, est celle qu'il faut exercer pour amener la masse en haut de la pente. Or le calcul trigonométrique nous montre que le module de ce vecteur n'est autre que la projection F * cos(θ). Il reste alors à multiplier celle-ci par la distance H pour obtenir le travail effectué. Et si la loi de conservation de l'énergie est vérifiée, c-à-d si :
W(h) = W(L)    ⇒
F * h = F * cos(θ) * L    ⇔
h = cos(θ) * L
(qui est donc une façon de vérifier expérimentalement que la loi de conservation de l'énergie est vraie).

Formulation. Mathématiquement, et plus généralement, le produit de F (vecteur "force") et L (vecteur "déplacement") peut être vu comme le produit de la norme de F par la projection de la norme de L sur lui ou inversement : F * L = || F|| * || L|| * cos θ : c'est cela qu'on appelle "produit scalaire".

vecteur-produit.png

Interprétation. Le produit scalaire est donc bien la formulation générale du travail, c-à-d pour une force F exercée dans une direction quelconque par rapport à celle du déplacement L. La formulation simplifiée W = F * L n_travail correspondant au cas où ces deux directions sont parallèles ⇔ θ=0cos(θ)=1. Autrement dit, le travail effectué pour lever une masse d'une hauteur L est indépendant de la trajectoire L' ≥ L suivie pour aller de la position initiale à la position finale (NB : ce fait résulte du principe de conservation de l'énergie).

Forme trigonométrique (géométrique) :
F * L = F * L * cos θ     ⇔
N.B. Le produit de deux vecteurs n'est donc pas un vecteur mais un nombre ! C'est pourquoi ce produit est dit "scalaire".
F * L = F * L * cos ( φ - λ )
⇒ par n_cos(a-b) : cos(φ-λ) = cos φ * cos λ + sin φ * sin λ :
F * L = F * cos φ * L * cos φ + F * sin φ * L * sin λ    ⇔
par n_sinus et par n_cos(a)=x/R :
Forme algébrique :
F * L = Fx * Lx + Fy * Ly = (Fx, Fy) * (Lx, Ly)

Ces deux formes pourront être utilisées complémentairement pour résoudre certains problèmes. On peut ainsi démontrer le théorème de Pythagore à partir du produit d'un vecteur par lui même :
forme trigonométrique : a * a = ... = ||a||2
forme algébrique : a * a = ... = ax2 + ay2
⇒ ||a|| = √(ax2 + ay2)

Propriétés. On peut alors démontrer facilement les propriétés du produit scalaire :

  • commutatif : oui;
  • distributif : oui;
    a * ( b + c ) = ax * (bx + cx) + ay * (by + cy) = ...
  • associatif = non car le produit de trois vecteurs ne fait pas sens puisque le produit de deux vecteurs est un nombre.
  • pour la même raison (le produit de deux vecteurs est un nombre) on ne peut jamais diviser par un vecteur : ni un nombre ni un scalaire.
  • le produit scalaire de deux vecteurs perpendiculaires vaut zéro, puisque cosθ=0 si θ=π/2.

Produit vectoriel

https://jortay.net/savoir-de-base#produit-vectoriel
moment-de-force.png

La composante longitudinale n'intervient pas dans la force de torsion → c'est F*sin(θ) que le moment τ rapporte à r.

Soit un levier (en l'occurrence une clé) par rapport auquel est défini le moment de force (qui est un moment de torsion) τ = r * F * sin(θ)
r est la longueur du bras de levier, et F la force exercée sur ce bras.
Le moment de force exprime tout simplement la proportionnalité entre la force F*sin(θ) et le la longueur du levier : si je double celle-ci, je peux diminuer de moitié la force exercée sur lui (pour arriver au même résultat).

Ce modèle mathématique qui quantifie l'intensité (le "module" infra) de l'effort de torsion ne dit cependant rien sur le sens de rotation qui est induit par cet effort (en l'occurrence on ne sait pas si on serre on déserre). L'illustration géométrique ci-dessus donne certes la réponse, mais il reste à la formuler mathématiquement. Pour ce faire le modèle a été complété par un outil mathématique appelé "produit vectoriel", consistant à représenter τ, r et F par des vecteurs : τ = r x F (NB : notez le "x" qui a remplacé le "*" de l'expression du module donnée par n_τ=r*F*sin(θ) ). Ainsi dans le graphique ci-dessus :

  • l'origine du vecteur "bras de levier" r représente le centre de rotation de la force, tandis que son extrémité représente le point d'application de cette force ;
  • la direction du vecteur "force" F est donnée par l'angle θ.

NB : étant maintenant représentées sous forme de vecteurs, les grandeurs r et F ne doivent plus nécessairement être dessinées à la suite l'une de l'autre, mais peuvent aussi bien être ramenées à une origine commune.

produit-vectoriel.png

On va ainsi reformuler n_τ=r*F*sin(θ) sous forme vectorielle, en considérant des vecteurs quelconques à origine commune :
c = a x b = || a|| * || b|| * sin(θ) * 1
Le produit vectoriel se lit « a croix b ».
où :
1, qui est un vecteur de longueur unitaire, convertit le nombre || a|| * || b|| * sin(θ) en vecteur;
indique que le signe de 1 est déterminé par la règle de la main droite, et que le produit vectoriel est perpendiculaire au plan constitué par ses composantes.

La règle de la main droite est un convention qui permet de déterminer le sens du produit scalaire c (c-à-d τ) : « quand le pouce de la main droite va dans le sens du vecteur c, alors le sens dans lequel se plient les autres doigts indique le sens de rotation de c ». Autrement dit : soit le produit scalaire a x b replier la main droite sur l'angle formé par a et b à partir de a ⇒ le pouce indique le sens de c. Ainsi dans le premier graphique illustrant le moment de force on appuie vers le bas et on visse (ce qui est indiqué par le signe "plume de flèche" ⊗, la direction opposée étant indiquée par signe "pointe de flèche" ⊙).

  • C'est donc au travers du vecteur unitaire 1, et surtout de son signe, que la règle de la main droite est exprimée dans la formule du produit vectoriel.
  • Le produit vectoriel a x b = || a|| * || b|| * sin(θ) * 1 ne doit pas être confondu avec le produit scalaire a * b = || a|| * || b|| * cos(θ) : notamment parce que le premier est un vecteur tandis que le second est un nombre !
Application

Force de Lorentz. Un exemple d'application du produit vectoriel est la force de Lorentz, c-à-d la force dite "magnétique" subie par une particule chargée dans un champ électromagnétique. Quand une charge électrique q se déplace à une vitesse v dans le champs magnétique B d'un aimant, elle subit une force :

f = q * v x B

force-lorentz.png

Le graphique ci-joint montre comment la direction et le sens de f sont facilement déterminés par la règle de la main droite.

Dans le cas particulier où la particule se déplace dans le sens du champs magnétique, l'angle θ est alors nul ⇒ son sinus également ⇒ le produit vectoriel q * v x B également : la force électromagnétique subie par la charge est nulle.

On constate ici toute la puissance du produit vectoriel, permettant de décrire par un simple produit vectoriel, un phénomène aussi complexe que celui décrit ici.

force-lorentz.png

Reprenons maintenant la même situation que dans le graphique supra, mais en nous plaçant maintenant face au champs magnétique. La "pointe de flèche" verte montre que le champs magnétique "sort de l'écran" dans notre direction. Le module de la force magnétique est f = q * v * B * sinθ où θ est l'angle entre la vitesse de la charge et le champs magnétique. Or comme par définition de la règle de la main droite, cet angle vaut π/2 ⇒ sinθ=1.

La force magnétique infléchit la trajectoire de la charge vers le bas, de sorte que cette trajectoire est courbée (la vitesse est donc inclinée vers le bas puisque la vitesse est toujours tangente à la trajectoire). La force magnétique demeure évidemment perpendiculaire à la vitesse ⇒ ( v x B ) * v = 0 par n_produit-scalaire-angle-droit ⇒ le produit scalaire f * v = 0. Or on peut démontrer (en faisant référence à la mécanique avancée) que f * v traduit l'énergie fournie à la charge. Le champs électrique n'induit donc pas d'énergie cinétique ⇒ la vitesse de la particule est constante (en module). Or comme q et B sont donnés ⇒ f = q * v * B est également constante ⇒ la trajectoire est infléchie de façon constante ⇒ la courbure est constante ⇒ la trajectoire de la charge forme un cercle. Si on introduit alors la notion de force centrifuge qui équilibre la force centripète f (cf. n_troisieme-loi-newton ), on peut alors montrer que le rayon de courbure de ce cercle vaut R = M * v / ( q * B )m représente la masse de la particule. C'est grâce à la mesure de cette courbure que l'on peut identifier des particules élémentaires étudiées dans des laboratoires tels que le CERN. Si la particule est ralentie dans le détecteur, alors ce sont des spirales qui apparaissent jusqu'à former un point associé à la particule.

Propriétés :

  • commutatif : non, en raison de la règle de la main droite (NB : a x b peut se lire « produit scalaire de a vers b ») :
    a x b = - b x a
    en l'occurrence il s'agit donc d'anticommutativité
    a x a = 0 par n_prod-vect où θ=0.
  • associatif : non, ce que l'on démontre facilement à partir de ( a x a ) x b
  • distributif : oui.
produit-vectoriel-calcul.png

Règle de calcul. Grâce aux propriétés n_a→xa→=0 et de distributivité on va développer une règle de calcul du produit vectoriel. Une condition est que le référentiel orthonormé soit dextrogyre c-à-d tel que x x y = z ⇔ règle de la main droite : quand on ferme les doigts de la main de x vers y la direction indiquée par le pouce doit être celle de z ⇔ :

1z = 1x x 1y
1x = 1y x 1z
1y = 1z x 1x

Dès lors, il résulte de la définition de l'addition vectorielle n_scalaires-additions :
a x b = ( ax * 1x + ay * 1y + az * 1z ) x ( bx * 1x + by * 1y + bz * 1z )

Pour simplifier le calcul de cette distribution on va utiliser un moyen mnémotechnique fondé le déterminant de a x b :

a x b =  
1x 1y 1z
ax ay az
bx by bz


a x b = ( ay * bz - az * by ) * 1x - ( ax * bz - az * bx ) * 1y + ( ax * by - ay * bx ) * 1z

NB : en raison de la règle de la main droite, pour le croisement L1-C2 il faut multiplier 1y par -1

produit-vectoriel-interpretation.png

Interprétations géométriques. Le graphique ci-contre reprend celui illustrant c = a x b = || a|| * || b|| * sin(θ) * 1 n_prod-vect, mais cette fois vu du haut. Il apparaît alors que le produit vectoriel correspond à la surface du parallélogramme construit sur les vecteurs a et b : a x b = Sab * 1Sab est donc le module du produit.

produit-mixte.png

Soit un vecteur quelconque c, il résulte de la propriété ci-dessus que le produit scalaire (par c) du produit vectoriel a x b :
( a x b ) * c = Sab * 1 * c = Sab * c * cos(φ) = Sab * h
appelé "produit mixte" (et lu "a croix b fois c"),
représente le volume du parallélépipède quelconque
(c-à- pas nécessairement rectangle) du graphique ci-joint, dont la valeur se calcule à partir de n_prod-scal-det : ( a x b ) * c =

1x 1y 1z
ax ay az
bx by bz
* c =
cx cy cz
ax ay az
bx by bz

On démontre cette égalité en remplaçant le déterminant du premier membre par un vecteur quelconque u et en montrant que pour obtenir le produit scalaire de celui-ci avec c il suffit de remplacer les coordonnée de 1 par celles de c :

ux * cx + uy * cy + uz * cz
=
ux * 1x + uy * 1y + uz * 1z
*
cx * 1x + cy * 1y + cz * 1z
CQFD

( a x b ) * c = cx * ( ay * bz - az * by ) - cy * ( az * bx - ax * bz ) + cz * ( ax * by - ay * bx )

Équation de la droite

https://jortay.net/savoir-de-base#equation-droite

Nous allons montrer ici que l'on peut exprimer l'équation de la droite dans le plan sous deux formes (équivalentes) selon le type de contrainte imposée au vecteur "courant " r qui dessine la droite passant par le point de vecteur "position" p.

droite-forme-parametrique.png

Équation
paramétrique

L'équation paramétrique de la droite, exprimée en fonction de vecteurs :
r = p + λ * v
exprime un contrainte fondée sur un vecteur directeur v (parallèle à la droite) et un paramètre λ ∈ ℝ;
⇒ exprimée en fonction de composantes des vecteurs :
x = px + λ * vx
y = py + λ * vy

NB : si plutôt qu'un vecteur directeur v on utilise un second vecteur position p' par lequel doit passer la droite alors il faut remplacer vx par p'x - px et vy par p'y - py.

L'équation paramétrique de la droite exprimée en fonction des composantes des vecteurs permet ainsi à un ordinateur de tracer la droite, en faisant varier la valeur du paramètre λ, étant données les coordonnées du vecteur position p et du vecteur directeur v (ou d'un second vecteur position p').

Équation
cartésienne

En substituant λ entre les deux égalités de equation-droite-plan-param-composantes on pourra exprimer y et x en fonction l'un de l'autre, ce que constitue la forme cartésienne de la droite :
( x - px ) / vx = ( y - py ) / vy    ⇔
y = vy / vx * x + py - vy / vx * px
(NB : qui est de type y = a * x + b)
Mais cette forme n'est pas l'expression générale de l'équation cartésienne de la droite car elle ne permet pas d'exprimer la droite verticale : en effet dans ce cas la pente vy / vx est infinie ⇒ on peut avoir y = ∞ - ∞, qui est indéterminé. Pour contourner ce problème on multiplie les deux membres par vx ⇒ on obtient l'équation sous sa forme générale :
- vy * x + vx * y = - vy * px + vx * py
(NB : qui est de type a * x + b * y = c)
dont un cas remarquable est celui de la droite verticale dont l'équation est donc x=px.

La façon la plus simple de dessiner une droite à partir de son équation cartésienne a * x + b * y = c est de calculer le point ou les deux points d'intersection avec les axes X et Y : il suffit de poser x=0 et de calculer la valeur correspondante de y (=c/b), puis de poser y=0 et de calculer la valeur correspondante de x (=c/a).

droite-forme-vectorielle.png

Forme
vectorielle

On va maintenant développer une interprétation géométrique de l'équation cartésienne, sous forme vectorielle. Pour ce faire la contrainte imposée au vecteur "courant" r relativement au vecteur "position" p n'est plus le couple (paramètre λ, vecteur "directeur" v) mais un vecteur "normal" n (perpendiculaire à la droite) :
n * r = n * p    ⇔
n * r * cos(φ) = n * p * cos(θ)
soit un produit scalaire signifiant que p et r on la même projection sur n.

Enfin soient : n = (a, b), p = (px, py) et r = (x, y)
⇒ par n_F*L=Fx*Lx+Fy*Ly :
a * x + b * y = a * px + b * py

droite-formes-bouclage.png

L'on peut alors comparer n_a*x+b*y=a*px+b*py à n_-vy*x+vx*y=-vy*py+vx*py pour constater que les coordonnées du vecteur normal n = (a, b) ont remplacé les coordonnées (-vy, vx) ... qui sont bien celles du point déterminé par la rotation à 90° du vecteur directeur v !

La boucle est ainsi bouclée dans ce tour des différentes expressions de l'équation de la droite dans le plan.

Équation du second degré

https://jortay.net/savoir-de-base#equation-second-degre

Soit l'équation polynomiale de degré n :
i=0n ai * x i = 0

Si n=2 on obtient le polynôme du second degré a0 + a1 * x + a2 * x2, que l'on écrit plus souvent sous la forme a * x2 + b * x + c (forme "standard").

Si a * x2 + b * x + c = 0 est l'équation polynomiale du second degré, on pourrait se demander ce qu'est a * x2 + b * x + c = d. La réponse est que « c'est également une équation polynomiale du second degré » :
a * x2 + b * x + c = d    ⇔
a * x2 + b * x + ( c - d ) = 0    ⇔

Résolution
algébrique

Pour trouver la solution de l'équation du second degré a * x2 + b * x + c = 0, c-à-d exprimer x en fonction de la valeur des paramètres, on va appliquer une méthode en 4 étapes :

  1. isoler x :
    a * x2 + b * x + c = 0    ⇒
    en posant : b * x + c = - h    ⇒
    a * x2 - h = 0    ⇔
    x = +/- √ ( h / a )
  2. passer à la forme canonique :
    on voit que dans la relation biunivoque :
    a * x2 - h = 0   ⇔   x = +/- √ ( h / a )
    on peut remplacer x par x-e    ⇒
    a * ( x - e )2 - h = 0   ⇔   x = e +/- √ ( h / a )
  3. calculer les équivalences en e et h, entre formes canonique et standard :
    a * ( x - e )2 - h = 0    ⇔    ( forme canonique)
    a * x2 - 2 * a * e * x + a * e2    ⇒
    par comparaison avec :
    a * x2 + b * x + c    ( forme standard)
    on voit que :
    b = - 2 a * e * x
    c = a * e2 - h


    e = - b / ( 2 * a )
    h = a * e2 - c =   ⇒   h = b2 / ( 4 * a ) - c

  4. Substituer les valeurs de e et h dans la solution canonique (point 2) :
    x = - b / ( 2 * a ) +/- √ ( b2 / ( 4 * a2 ) - c / a )    ⇔
    x = [ - b +/- √ ( b2 - 4 * a * c ) ] / ( 2 * a )
    PS : ces deux valeurs (notez le +/-) sont appelées "racines de l'équation du second degré".

Pour qu'une solution existe il faut que la partie en racine carrée soit non négative : b2 - 4 * a * c ≥ 0 (car il n'existe pas de racine carrée d'un nombre négatif puisque tout carré est positif). Cette partie en racine carrée est appelée "discriminant" de l'équation (et notée Δ) car elle différencie les valeurs respectives des deux "racines" (on ne dit pas "solution" car c'est leur ensemble qui constitue la solution).

Interprétation
géométrique

Comprenons bien la différence entre le graphe y = a * x2 + b * x + c (la courbe rouge, telle que x est en abscisse et y(x) = a * x2 + b * x + c en ordonnée), et le cas particulier y = a * x2 + b * x + c = 0 déterminant les deux "zéros" du polynôme (les deux points jaunes).

solutions-polynome.png

Pour affiner l'interprétation géométrique on va étudier divers paramétrages du polynôme, c-à-d l'effet de diverses valeurs des paramètres a, b et c sur le graphe de la fonction polynomiale y = a * x2 + b * x + c. Le premier est celui de b=c=0 ⇒ y = a * x2

parabole.png

Passons maintenant à y = a * x2 - h (étape 1 du développement mathématique supra). Nous voyons que cela correspond à un mouvement vertical de la parabole.

parabole-h.png

On voit alors apparaître les "zéros" de la fonctions. On voit également que si h/a est négatif alors la valeur minimale de y est supérieure à zéro et il n'y a donc plus de "zéros" (ligne hachurée).

parabole-h-valeurs.png

Passons maintenant à y = a * ( x - e )2 - h (étape 2 du développement mathématique supra), ce qui correspond à un mouvement horizontal de la parabole. Pour le comprendre il suffit de poser x=e ⇒ y=-h ⇔ la parabole se déplace horizontalement et vers la droite. In en résulte que l'axe de symétrie est passé de x=0 à x=e.

parabole-e.png

On voit enfin que la valeur de a détermine l'ouverture de la parabole : plus a est grand plus la valeur de y est élevée pour un x donné.

parabole-a.png

En résumé pour la forme canonique y = a * ( x - e )2 - h :

  • h détermine le minimum de la parabole, et donc le déplacement vertical ;
  • e détermine la position de l'axe de symétrie, et donc le déplacement horizontal ;
  • a détermine l'ouverture de la parabole.

Le graphique suivant exprime la situation cette fois en termes standards.

parabole-standard.png

Distinguons dans la solution encadrée en vert les deux membres de l'addition/différence : le membre de gauche (-b/(2a) c-à-d e) détermine l'axe de symétrie, tandis que le membre de droite détermine l'ouverture de la parabole. Quant à la position du minimum de la parabole, elle est fonction du signe du discriminant Δ :

  • Δ > 0 ⇔ minimum en-dessous de l'axe horizontal ⇔ deux "zéros"  ;
  • Δ= 0 ⇔ minimum sur l'axe horizontal ⇔ un seul "zéro"  ;
  • Δ < 0 ⇔ minimum au-dessus de l'axe horizontal ⇔ pas de "zéro".
Illustration

La trajectoire balistique d'un corps lancé dans l'espace en présence de gravitation est donnée par l'expression du graphique ci-dessous, qui est bien un polynôme du second degré. On notera le signe négatif lié à la gravitation g (puisque celle-ci est orientée vers le bas). Le signe du paramètre a dans y(x) = a * x2 + b * x + c étant ainsi négatif la parabole est bien concave. Il y a cohérence entre formulation théorique et réalité physique.

courbe-balistique.png

On veut calculer l'endroit où placer le matelas, c-à-d la valeur de x correspondant à y=0. L'équation a * x2 + b * x + c = 0 correspond donc à la problématique. La solution se trouve dans la valeur des racines dont nous avons calculé la formule. Les valeurs des paramètres g, v φ et h étant connues, il en va de même pour les paramètres correspondants a, b et c. Il reste à calculer la valeur de x ... en veillant à utiliser les mêmes unités de longueur (PS : on notera à cet égard que la tangente n'a pas de dimension ⇒ ok pour x1).

Mais il reste à interpréter correctement les résultats, c-à-d en fonction de la réalité physique. En l'occurrence il apparaît qu'une des deux racine est nécessairement négative (puisqu'on a placé le zéro des abscisse au niveau du canon) et ne correspond ici à aucune réalité physique.

On va enfin calculer la hauteur maximale H que le clown va atteindre afin de vérifier que le chapiteau est suffisamment haut. L'équation du second degré correspondant à cette problématique est :
a * x2 + b * x + c = H     ⇔
a * x2 + b * x + ( c - H ) = 0

Le graphique suivant montre que cette valeur maximale ne sera pas atteinte tant qu'il y aura deux racines, c-à-d tant que le discriminant sera positif.

courbe-balistique-2.png

On comprend alors que la solution correspond à Δ=0 ce qui nous permet de trouver la valeur de H (NB : ... en veillant à remplacer c par c'=c-H dans la formule du discriminant).

courbe-balistique-3.png

Algèbre

https://jortay.net/savoir-de-base#algebre

La dynamique, étude des mouvements, a soulevé de nombreuses questions, dont la résolution s'est faite grâce à l'invention de techniques de calcul.

 4.1. Dérivée
 4.2. Intégrale
 4.3. Nombres imaginaires et complexes
 4.4. Analyse combinatoire
 4.5. Suites mathématiques
 4.6. Fonction exponentielle
 4.7. Matrices

Dérivée

https://jortay.net/savoir-de-base#derivee

La dérivée f '(x) = df(x) / dx c'est la pente de la courbe, ou encore la sensibilité (c-à-d le taux de variation) de f(x) par rapport à x. Ainsi si x est le temps écoulé et f(x) la distance parcourue alors ce taux de variation est la vitesse. Nous allons voir que la dérivée correspond à la vitesse dite "instantanée" c-à-d en un point déterminé, par opposition avec la vitesse moyenne Δy / Δt c-à-d entre deux points déterminés.

derivee1.png

C'est de cette vitesse moyenne que nous allons d'ailleurs déduire celle de vitesse instantanée. La vitesse est constante ⇔ la pente de la courbe est constante en tous points (droite verte). Ou encore la pente de la droite verte représente la vitesse moyenne de la courbe rouge.

De même l'on pourrait calculer la vitesse sur seulement un segment de la fonction, comme illustré dans le graphique suivant.

derivee2.png

Le principe de la dérivée est alors qu'en diminuant Δt = tf - ti "à l'infini" c-à-d jusqu'à une valeur "arbitrairement proche de zéro" (infinitésimale), on pourra toujours atteindre une échelle suffisamment petite pour que le segment de la courbe déterminé par Δt puisse être considéré comme une droite.

Ainsi Δy et Δt tendent tous les deux vers zéro, mais leur ratio est constant (puisqu'il le segment infinitésimal peut être considéré comme une droite) et vaut :
v(t) = limΔt → 0 Δy / Δt     ⇔
v(t) = limΔt → 0 ( y( t + Δt ) - y(t) ) / Δt
que l'on simplifie en posant que :
si Δt → 0 alors Δt = dt :
(notation "différentielle", qui est donc une différence infinitésimale, faisant passer d'une description discrète à un continuum, et l'on passe ainsi de la notion de vitesse moyenne à celle de vitesse instantanée)    ⇒
v(t) = ( y( t + dt ) - y(t) ) / dt     ⇔
v(t) = dy(t) / dt

Généralisation :
f '(x) = df (x) / dx = ( f ( x + dx ) - f (x) ) / dx
La première égalité définit la notation simplifiée.
Le deuxième égalité définit le mode de calcul.
La dérivée d'une fonction f(x) est donc le rapport entre la différentielle de la fonction f(x) et la différentielle de la variable x.

derivee3.png

La dérivée est elle-même une fonction (exemple à partir d'une f(x) quelconque).

Exemples :

Soit la fonction :
f (x) = x 2
appliquée à n_derivee    ⇒
d(x 2) / dx = ( ( x + dx ) 2 - x 2 ) / dx     ⇔
d(x 2) / dx = ( ( x 2 + 2 * x * dx + dx 2 ) - x 2 ) / dx     ⇔
d(x 2) / dx = 2 * x + dx
où par définition dx peut-être arbitrairement petit et donc considéré comme négligeable par rapport à 2*x     ⇒
d(x 2) / dx = 2 * x

Soit la fonction :
f (x) = 1 / x
appliquée à n_derivee    ⇒
d(1/x) / dx = ( 1 / ( x + dx ) - 1 / x ) / dx     ⇔
en réduisant le numérateur au même dénominateur :
d(1/x) / dx = - 1 / ( x 2 + x * dx )
où par définition dx peut-être arbitrairement petit, de sorte que x*dx peut être considéré comme négligeable par rapport à x2     ⇒
d(1/x) / dx = - 1 / x 2

Propriétés

À partir de f '(x) = df (x) / dx = [ f ( x + dx ) - f (x) ] / dx n_derivee on démontre les propriétés suivantes.

Dérivée d'une somme de fonction :
d( ∑ fi (x) ) / dx =
[ ∑ fi (x + dx) - ∑ fi (x) ] / dx =
la différence de sommes est une somme de différences :
[ ∑ ( fi (x + dx) - fi (x) ) ] / dx =
distribution de 1/dx :
∑ [ ( fi (x + dx) - fi (x) ) / dx ] =
∑ ( dfi (x) / dx )
CQFD

Dérivée d'un produit de fonctions :
d( π fi (x) ) / dx =
[ π fi (x + dx) - π fi (x) ] / dx =
par définition de dfi (x) = fi (x + dx) - fi (x) :
[ π ( fi (x) + dfi (x) ) - π fi (x) ] / dx = ?
Si l'on continue la démonstration sur cette voie générale ça va devenir difficilement lisible ⇒ on va plutôt passer par les cas n=2 et n=3 ; en outre, toutes les fonctions de la dernière étape étant en x, on va simplifier l'écriture en ne mentionnant plus x :
n=2 :
d( f * g ) / dx =
[ ( f + df ) * ( g + dg ) - f * g ] / dx =
[ f * g + f * dg + df * g + df * dg - f * g ] / dx =
f * g ' + f ' * g + df * dg / dx =
f * g ' + f ' * g + f ' * g' * dx    ⇔
( f * g )' = f ' * g + f * g '
n=3 :
d( f * h * i ) / dx =
en posant g(x) = h(x) * i(x) dans n_d(f*g)/dx :
f * ( h * i ) ' + f ' * ( h * i ) =
f * ( h * i' + h' * i ) + f ' * ( h * i ) =
f * h * i' + f * h' * i + f ' h * i )
où l'on constate une symétrie : le signe de dérivée passe progressivement d'un côté à l'autre, ce que l'on peut généraliser comme suit :
( π1 n fi )' = ∑i=1 n ( fi' * π1 i-1 fi * π i+1 n-1 fi )
CQFD
Ainsi dans le cas particulier fi = f   ∀ i :
( f n ) ' = n * f n-1 * f '
dont deux cas particuliers sont les fonctions :

  • identité : f (x) = x
    ( x n ) ' = dx n / dx = n * x n-1
  • inverse : f (x) = 1 / x = x -1
    ( x - n ) ' = dx - n / dx = - n * x -n-1

Dérivée d'un quotient de deux fonctions :
d( f (x) / g (x) ) / dx = d( f / g ) / dx = d( f * g - 1 ) / dx    ⇔
par n_d(f*g)/dx :
d( f / g ) / dx = f ' * g - 1 + f * g - 1 '    ⇔
par n_dfn(x)/dx :
d( f / g ) / dx = f ' * g - 1 - f * g - 2 * g '    ⇔
d( f / g ) / dx = ( f ' * g - f * g ' ) / g 2

Cependant la démonstration ci-dessus est incomplète car elle repose sur l'hypothèse non démontrée que n_dfn(x)/dx vaut également pour les entiers (n) négatifs. Pour démontrer cette hypothèse on va développer la différentielle d'un quotient particulier : f - n, cela en partant de sa définition :

f n * f - n = 1    ⇔
( f n * f - n ) ' = 0    ⇔
par n_d(f*g)/dx :
( f n ) ' * f - n + f n * ( f - n ) ' = 0    ⇔
( f - n ) ' = - ( f n ) ' * f - 2n    ⇔
( f - n ) ' = - n * f n-1 * f ' * f - 2n    ⇔
( f - n ) ' = - n * f -n-1 * f '
CQFD.

Dérivée de fonctions trigonométriques :
dcos(α) / dα = [ cos(α + dα) - cos(α) ] / dα    ⇔
par cos(a+b) = cos(a) * cos(b) - sin(a) * sin(b) n_cos(a+b) :
dcos(α) / dα = [ cos(α) * cos(dα) - sin(α) * sin(dα) - cos(α ] / dα    ⇔
dcos(α) / dα = - sin(α) * sin(dα) / dα    ⇒
par démonstration infra de sin(dα) = dα :
dcos(α) / dα = - sin(α)
Et on démontre de la même manière, cette fois à partir de n_sin(a+b), que :
dsin(α) / dα = cos(α)

derivee-cos.png

L'égalité sin(dα) = dα se démontre géométriquement à partir des définitions de l'angle radian n_radian et du sinus n_sinus : graphique ci-contre : la variation infinitésimale d'un angle α correspond à l'égalité "à la limite" entre l'arc-tangente (en rouge) et le sinus (en vert) : limα→0 sin(Δα) / dα = 1

Dérivée d'une fonction composée :
la démonstration est triviale :
dF( G(x) ) / dx =
dF( G(x) ) / dG(x) / ( dx / dG(x) )    ⇔
dF( G(x) ) / dx = dF( G(x) ) / dG(x) * dG(x) / dx   ⇔
( F[ G(x) ] )' = F'( G(x) ) * G'(x)

Intégrale

https://jortay.net/savoir-de-base#integrale
triangle-clipedia.png Vidéo Clipedia : L'intégrale : introduction

Dans la section précédente nous avons vu que "dériver" (par rapport au temps) consiste à calculer le taux de variation à partir de la variation. L'opération inverse, c-à-d calculer le taux de variation à partir de la variation, s'appelle "intégrer". Pour ce faire l'équation xt - x0 = v * t n_vitesse du MRU suffit car v est constant. Mais si le taux de variation est variable (cas du MRUA) alors on devra utiliser un nouvel outil mathématique : l'intégrale.

Le principe de l'intégrale consiste à découper le temps en tranches et d'attribuer à chacune une vitesse constante qui n'est autre que la vitesse moyenne de cette tranche. Nous avons vu dans l'illustration du MRU n_vitesse que la surface du rectangle correspondant est précisément la variation que l'on souhaite retrouver (en l'occurrence la distance parcourue).

Dès lors pour affiner l'intégration on passe à des variations infinitésimales (⇒ on remplace les Δt par des dt) et donc à un nombre infini de tranches. Ce faisant on remplace la fonction discontinue vn = Δxn / Δt par la fonction continue v(t) = dx(t) / dt.

integrale.png

Maintenant que nous avons exposé la signification géométrique d'une intégrale nous allons voir comment la calculer. Mais pour cela il nous faut d'abord transformer le résultat du graphique de droite ci-dessus en une fonction du temps c-à-d que l'on considère x( t f ) comme variable de sorte que l'on remplace x( t f ) par x(t), et que x( t i ) est considéré comme connu (et passe donc dans le membre de droite). Il nous faut également distinguer le t de la variable du t représentant la borne finale de l'intégrale ⇒ on remplace le premier par t'.

Après ces corrections de notations on obtient : x(t) = x(t i) + ∫ t it v(t') * dt'

Le calcul d'une intégrale se résume alors en un règle simple : « l'intégrale de f(x) est la différence des primitives de f(x) entre les bornes » :

x ix f f(x) * dx = F(xf) - F(xi)
que l'on note aussi [ F(x) ] x ix f
F(x) est appelée "primitive" de "l'intégrande" f(x), et est telle que
F(x) = ∫ f(x) * dxdF(x) / dx = f(x)
NB : primitive et dérivée sont donc des fonctions inverses.

Pour montrer le raisonnement conduisant à n_integrale on part de
x(t) = x(t i) + ∫ t it v(t') * dt' n_integrale-continue
appliquée au MRU c-à-d telle que v(t')=v0
Or dans ce cas on sait que la solution est x(ti) = v0 * t + x0 n_vitesse
qui vaut aussi pour x(ti) = v0 * ti + x0
que l'on substitue dans n_integrale-continue
t it v(t') * dt' = v0 * t - v0 * ti
Comme on est dans le cas v(t')=v0 ⇒ on vérifie bien que :
t it v0 * dt' = v0 * ( t - ti )    ⇔
v0 * ∫ t it dt' = v0 * ( t - ti )    ⇔
v0 * ( t - ti ) = v0 * ( t - ti )

Ce résultat obtenu pour v(t')=v0 on le généralise à toute fonction v(t') en posant
t it v(t') * dt' = V(t) - V(ti )
V(t) est telle que dV(t) / dt = v(t')

On peut alors démontrer formellement n_integrale en partant de la primitive
V(t) = ∫ t*t v(t') * dt' + C    ⇔
V(t) = ∫ t*ti v(t') * dt' + ∫ ti t v(t') * dt' + C   ⇔
V(t) = V(ti) - C + ∫ ti t v(t') * dt' + C   ⇔
ti tv(t') * dt' = V(t)- V(ti)
CQFD

La principale difficulté du calcul d'une intégrale consiste donc en l'identification de la primitive de l'intégrande.

Quelques primitives fréquentes

Intégrande f(x)Primitive F(x)
1 / xln(x)
1 / x2- 1 / x
sin(x)- cos(x)

On peut maintenant démontrer mathématiquement l'équation du MRUA xt = x0 + v0 * t + a * t2 / 2 n_xt=x0+v0*t en appliquant n_integrale pour calculer la distance parcourue, étant donnée l'équation de la vitesse vt = v0 + a * t n_a=v(t)/t :
xt - x0 = ∫ 0 tv(t') * dt' = V(t)- V(0)
or si vt = v0 + a * tV(t) = C + v0 * t + a/2 * t2    ⇒
xt - x0 = C + v0 * t + a/2 * t2 - C    ⇔
xt = x0 + v0 * t + a/2 * t2
CQFD

On va pouvoir également calculer la puissance de l'énergie nucléaire. Celle-ci consiste en la fission du noyau d'atome, ce qui provoque son explosion par expulsion des protons qu'il contient, puisque ceux-ci sont des charges électriques positives, qui se repoussent mutuellement.

La force électrique de répulsion entre les charges positives que sont les protons fournit donc un travail W à ceux-ci, qui acquièrent ainsi une certaine vitesse et, partant, une certaine énergie cinétique Ec = M * v2 / 2 n_energie-cinetique. Et en vertu du principe de conservation on a que W = Ec. Or W = f * x(t) n_travail, mais dans cette formule F est considérée comme constante, or la force électrique diminue avec la distance entre les charges : f(r) = kC * q1 * q1 / r 2 n_force-de-coulomb (NB : le modèle de calcul est ici composé de deux protons dont l'un est considéré immobile). La solution consiste à considérer la force électrique comme constante sur un segment infinitésimal dx.

explosion-atomique.png

Et puisque dx est une grandeur infinitésimale alors c'est aussi le cas du travail correspondant : dW = f(x) * dx (le rectangle bleu dans le graphique ci-dessus)    ⇒
W = ∫ dW = ∫ f(x) * dx = [ F(x) ]x0 =
[ - kC * qe2 / x ] x0 =
- kC * qe2 * [ 1 / ∞ - 1 / x0 ] =
- kC * qe2 * 1 / x0
où :
x0 est la distance entre nucléon du noyau c-à-d la taille d'un nucléon, soit un ordre de 10 * 10-15 m ;
kC = 9 * 109 N * m2 / C2
• qe = 1,6 * 10 -19 C
⇒ W = 23 * 10 -14 J
ce qui est extrêmement petit ... mais ne concerne qu'un seul proton ⇒ si on considère un nombre de protons égal au nombre d'Avogadro, c-à-d le nombre de protons contenus dans une mole, donc dans un gramme de protons, on obtient alors une valeur nettement plus grande :
1 g : W = 6 * 1023 * 23 * 10 -14 J = 138 * 109 J.
Un gramme de protons contient donc un potentiel d'énergie de milliards de joules !

Technique
d'intégration

Établir la formule qui donne l'aire du cercle en fonction de son rayon est un cas montrant qu'il est parfois difficile de calculer la primitive de façon usuelle, c'est-à-dire sur base de l'intuition. Dans ce cas la technique de changement de variable consiste à passer des coordonnées cartésiennes aux coordonnées polaires et d'ainsi obtenir une expression trigonométrique de l'intégrande, dont la primitive est facilement identifiée à partir de la formule du cosinus de l'arc double.

surface-cercle.png

Le premier réflexe est de définir l'intégrande à partir du théorème de Pythagore :
R2 = x2 + y2 n_pythagore n_pythagore-math   ⇔
y = √ ( R2 - x2 )    ⇒
S/4 = ∫ ds = ∫0R y(x) * dx = ∫0R √ ( R2 - x2 ) * dx
Or trouver la primitive de √ ( R2 - x2 ) est très difficile ...

surface-cercle-polaire.png

Il est intuitivement facile de comprendre qu'une solution plus adaptée au cercle est d'exprimer ses points en fonction de leur angle correspondant (coordonnées polaires) plutôt que de leur coordonnées x et y :
y = R * cos(θ)
x = R * sin(θ)    ⇒
dx / dθ = R * dsin(θ) / dθ    ⇒
par n_derivee-sin
dx / dθ = R * cos(θ)   ⇔
dx = R * cos(θ) * dθ    ⇒
on substitue les nouvelles expressions de y(x) et dx dans :
S/4 = ∫ ds = ∫0R y(x) * dx    ⇒
S/4 = ∫0π/2 R * cos(θ) * R * cos(θ) * dθ   ⇔
S/4 = ∫0π/2 R2 * cos2(θ) * dθ

surface-cercle-polaire-2.png

La nouvelle intégrande a une forme différente, mais la surface qui lui correspond est bien égale à S/4.

Maintenant il nous faut trouver la primitive de l'intégrande R2 * cos2(θ) que l'on va simplifier par :
cos(2*θ) = 2 * cos2(θ) - 1    n_cos(2a)   ⇔
cos2(θ) = 1/2 + cos(2*θ) / 2     ⇒
S/4 = R2 * ∫0π/2 [ 1/2 + cos(2*θ) / 2 ] * dθ    ⇒
par n_derivee-fonction-composee :
F(θ) = θ / 2 + 1/4 * sin(2*θ)    ⇒
S/4 = R2 * [ θ / 2 + 1/4 * sin(2*θ) ]0π/2   ⇔
S/4 = R2 * π/4    ⇔
S = π * R2

surface-cercle-2.png

Notons que cette démonstration a été développée pour illustrer la technique du changement de variable. Cependant la surface du cercle peut être calculée plus simplement en décomposant le cercle en une somme de triangles de base infinitésimale R * dθ et dont la surface est donc :
dS = R * dθ * R / 2 = R2 * dθ / 2    ⇒
S = ∫ dS = ∫0 R2 * dθ / 2    ⇔
S = R2 / 2 * [ θ ]0    ⇔
S = π * R2

Terminons en notant que ab k = ∞ puisque l'outil intégral est conçu pour sommer des éléments infinitésimaux à l'infini ⇒ si l'élément infinitésimal est absent alors la somme vaut nécessairement l'infini !

Nombres imaginaires et complexes

https://jortay.net/savoir-de-base#nombre-imaginaire-complexe

Les nombres imaginaires et les nombres complexes constituent un outil mathématique qui permet de faciliter grandement le traitement mathématique d’un très vaste nombre de phénomènes en physique : optique, relativité, mécanique quantique, électricité, ...

Une règle fondamentale de l'arithmétique en général et des nombre complexes en particulier est que « moins par moins donne plus » : -a * -b = a * b

Mais cette règle pose problème lorsqu'on l'applique à la racine d'un nombre.

Par définition la racine n-ième d'un nombre a – notée n a – est telle que ( √n a ) n = +/- a si n est paire et ( √n a ) n = a si n est impaire
ou encore
(   √2n a ) 2n = +/- a  et  (      √2n-1 a ) 2n-1 = a

Il découle de n_racine et ( a m ) n = a m*n n_puissance-de-puissance que n a = a 1/n

Il y a bien un problème dans le cas où a est négatif et n est paire : par exemple si n=2 alors il résulte de n_racine que √-4 * √-4 = +/- 4 ; or il résulte de n_moins-par-moins que le membre de gauche ne peut être que positif ...

triangle-clipedia.png Vidéo Clipedia : Les nombres imaginaires
Nombres
imaginaires

La solution au problème décrit ci-avant été inventée au 16° siècle par le physicien et mathématicien Cardano (inventeur du cardan) afin de rendre possible le calcul des racines du polynôme du troisième ordre (a * x3 + b * x2 + c * x + d = 0).

Cette solution consiste à poser que :
√-a = √( -1 * a) = √-1 * √a = i * √a
où par définition i = √-1, appelée "unité imaginaire" (*), est telle que i 2n = -1

Par conséquent, soit a un nombre réel, alors a * i est dit "nombre imaginaire" : I ≡ i * ℝ.

imaginaires-reels.png

La comparaison des deux droites illustre la nature "d'unité imaginaire" de i autour de zéro, ce dernier étant l'unique valeur commune aux deux ensembles iℝ et ℝ.

Ainsi la solution de l'équation du second degré n_racines-polynome :
x = ( - b +/- √D ) / ( 2 * a )
D ≥ 0

peut être généralisée en :
x = ( - b +/- d * √|D| ) / ( 2 * a )
d = 1 si D ≥ 0
d = i si D < 0

Ainsi en particulier l’équation x2 = −a  où  a > 0 a pour solutions x = +/- i * √a

Nombres
complexes

Un nombre complexe est la somme d'un terme réel et d'un terme imaginaire : z = x + i * y où x et y sont des réels : ℂ = ℝ +iℝ.

Les opérations sur nombres complexes consistent à appliquer les règles valables pour les réels aux parties des nombres complexes (en prenant en compte le fait que i 2 = −1) : soit z = x + i * y alors les parties réelle et imaginaire sont respectivement x et y (NB : y est appelé "partie" imaginaire tandis que i * y est appelé terme imaginaire ) :

  • addition :
    ( x1 + i * y1 ) + ( x2 + i * y2 ) = ( x1 + x 2 ) + i * ( y1 + y2 )
  • multiplication par un réel :
    a * ( x + i * y ) = a * x + i * a * y
  • multiplication par un autre complexe : distributivité de la multiplication sur l’addition ⇒
    ( x1 + i * y1 ) * ( x2 + i * y2 ) = ( x1 * x2 − y1 * y2 ) + i * ( x1 * y2 + x2 * y1 )

    dont découlent les cas particuliers :
    • carré :
      ( x + i * y ) 2 = x 2 - y 2 + i * 2 * x * y
      aussi par application du produit remarquable ( a + b ) 2 = a 2 + b 2 + 2 * a * b
    • multiplication par conjugué (soit z = x + i * yz = x - i * y) :
      ( x + i * y ) * ( x - i * y ) = x 2 + y 2
      aussi par application du produit remarquable ( a + b ) * (a - b ) = a 2 - b 2
      N.B. :
      • z * z ∈ ℝ 
      • on appelle module de z la racine carrée du produit par le conjugué : | z | = √ ( z * z ) = √ ( x 2 + y 2 )
  • division :
    z1 / z2 = z1 * z2 / | z2 | 2    ⇔
    ( a + i * b ) / ( c + i * d ) = ( a + i * b ) * ( c - i * d ) / ( c 2 + d 2 )
    Démonstration :
    z1 / z2 =
    en multipliant numérateur et dénominateur par le conjugué du dénominateur
    z1 * z2 / ( z2 * z2 ) =
    par n_module-complexe
    z1 * z2 / | z2 | 2
    CQFD

La nature réelle du module permet de calculer ainsi la division de deux nombres complexes plus rapidement qu'en développant x + i * y = ( a + i * b ) / ( c + i * d ) pour identifier a et b par un système de deux équations à deux inconnues x et y.

Représentation
géométrique

Il existe une ressemblance flagrante entre addition de deux nombres complexes et addition de deux vecteurs :

  • z1 + z2 = ( x1 + i * y1 ) + ( x2 + i * y2 ) = ( x1 + x 2 ) + i * ( y1 + y2 )
  • v1 + v 2 = (x1, x2y) + (y1, y2) = ( x1 + x2 , y1 + y2 ) n_scalaires-additions
complexes-representation-geometrique.png

Cela montre que l'on peut considérer un nombre complexe comme un vecteur, et donc le représenter géométriquement de la même manière : l'axe X pour la partie réelle du nombre complexe, et l'axe Y pour sa partie imaginaire .

complexes-module-geometrique.png

Également similarité pour la représentation géométrique et le calcul algébrique du module.

Ainsi les nombres complexes ayant le même module se trouvent sur un cercle de rayon module et centré sur l'origine. On peut également représenter les nombres complexes opposés (symétrique centrale, par rapport à l'origine), conjugués (symétrie axiale, par rapport à l'axe X), ou encore multipliés.

complexes-cas-partic--geometrique.png
Forme
polaire

Nous venons de voir qu'un nombre complexe peut être représenté géométriquement par des coordonnées cartésiennes d'un point. Il peut l'être également par des coordonnées polaires définissant le vecteur position de ce point par deux grandeurs : le module ρ et l'angle θ (appelé "argument" et mesuré relativement à l'axe X) : z = ρ * cos(θ) + i * ρ * sin(θ)

complexe-coordonnees-polaires.png

ρ est mesuré positivement dans le sens trigonométrique c-à-d anti-horlogique

Pourquoi "polaire" ? On parle de forme "polaire" par référence au système de méridiens et parallèles utilisé pour déterminer une position sur la surface d'un globe (donc en trois dimensions). Chaque méridien passe par les deux pôles et est défini par un certain nombre de degrés de longitude relativement au méridien de Greenwich. Chaque parallèle coupe les méridiens perpendiculairement et est défini par un certain nombre de degrés de latitude relativement à l'équateur. Les deux pôles nord et sud jouent donc le rôle de l'origine (0, 0) des graphiques ci-dessus, qui peuvent être vus comme si l'on regardait la sphère à partir d'un point situé sur la droite reliant les deux pôles ⇒ θ correspond alors à la longitude, l'axe X au méridien de Greenwich et ρ à la latitude.

Il y a identité entre le module du nombre complexe et celui du vecteur associé : | z | = ρ
Démonstration :
| z | = √ ( x 2 + y 2 )    n_module-complexe    ⇔
par n_sinus et n_cos(a)=x/R :
| z | = √ ( [ ρ * cos(θ) ] 2 + [ ρ * sin(θ) ] 2 )    ⇔
| z | = ρ * √ ( [ cos(θ) ] 2 + [ sin(θ) ] 2 )    ⇔
par n_sin2(a)+cos2(a)=1
| z | = ρ
CQFD

Nous avons donc deux formes des nombres complexes :

forme cartésiennez = x + i * y
forme polairez = ρ * cos(θ) + i * ρ * sin(θ)

Exprimer les coordonnées d'une forme en fonction des coordonnées de l'autre forme est trivial, sauf pour θ :

Coordonnées cartésiennesCoordonnées polaires
x = ρ * cos(θ)
y = ρ * sin(θ)
ρ = √ ( x 2 + y 2 )
θ = arctg( y / x )
complexe-argument.png

On démontre géométriquement la valeur de θ en dessinant un cercle centré sur l'origine et de rayon x.

On peut démontrer algébriquement la valeur de θ en divisant membre à membre les deux égalités de la colonne de gauche ci-dessus ⇒
y / x = sin(θ) / cos(θ)    ⇔
par n_tan(α)=sin(α)/cos(α)
y / x = tg(θ)    ⇔
θ = arctg( y / x )

complexe-arctg.png

N.B. Lors de l’emploi de la fonction arctan il faut veiller à choisir le quadrant correct pour θ, en ajoutant éventuellement 180° selon les signes des x et y. Ainsi le graphique ci-contre montre que lorsque x<0 la valeur donnée par la calculatrice (ici 56,3°) devra être augmentée de 180° afin d'obtenir la valeur de l'argument du nombre complexe. Cela est du au fait qu'une valeur de tangente correspond toujours à deux valeurs d'angles différant de 180°.

La forme polaire présente l'avantage de faciliter le calcul des produits et puissances de nombres complexes. La version du produit de complexes sous forme polaire s'obtient de la même façon que sous forme cartésienne n_complexe-produit-cartesien : par distribution :

[ ρ1 * ( cosθ1 + i * sinθ1 ) ] * [ ρ2 * ( cosθ2 + i * sinθ2 ) ] =
ρ1 * ρ2 * [ cos(θ1 * cos(θ2) - sin(θ1 * sin(θ2) ] + i * [ cos(θ1) * sin(θ2) + sin(θ1) * cos(θ2) ] =
par n_sin(a+b) et n_cos(a+b) :
ρ1 * ρ2 * [ cos( θ1 + θ2 ) + i * sin( θ1 + θ2 ) ]
⇒ en posant : ρ1 * ρ2 = ρ3  et  θ1 + θ2 = θ3
puis en réitérant le procédé on voit que l'on peut finalement généraliser par :
i=1 n ( ρi * ( cosθi + i * sinθi ) = ∏i=1 n( ρi ) * [ cos(∑i=1 nθi) + sin(∑i=1 nθi) ]
où n est un nombre entier positif, et dont un cas particulier remarquable est celui de ρi = ρ et θi = θ ∀ i :
[ ρ * ( cos(θ) + i * sin(θ) ] n = ρ n * ( cos( n * θ ) + i * sin( n * θ )

complexe-produit-polaires.png

Le graphique ci-contre illustre n_complexe-produit-polaire pour n=2.


complexe-cercle.png

Il résulte de n_complexe-produit-polaire que le produit de nombres complexes de module égal à 1 est également un module de valeur 1, de sorte qu'ils sont situés sur le même cercle de rayon 1 et centré sur l'origine. Ainsi le point de ce cercle correspondant à l'angle de 45° a comme partie réelle cos(45) et comme partie imaginaire sin(45) par n_complexe-polaire, qui valent toutes deux 1/√2 par n_sin(45)=cos(45)=1/√2. En développant le carré de ce complexe 1/√2 + i * 1/√2 on montre qu'il est égal à √i. Le graphique illustre notamment le cas où il est élevé à la puissance trois : sa valeur devient i * √i et son argument 3*45°=135° par n_complexe-produit-polaire.

On va maintenant démontrer que n_complexe-puissance-polaire est également vérifiée lorsque n est négatif :
[ ρ * ( cos(θ) + i * sin(θ) ] -n =
ρ -n * 1 / [ ( cos(θ) + i * sin(θ) ] n =
par n_complexe-produit-polaire où ρ=1 :
ρ -n * 1 / [ ( cos( n * θ ) + i * sin( n * θ ) ] =
par n_complexe-division :
ρ -n * [ cos( n * θ ) - i * sin( n * θ ) ] / | cos( n * θ ) + i * sin( n * θ ) | 2 =
par n_complexe-modules où ρ=1 :
ρ -n * [ ( cos( n * θ ) - i * sin( n * θ ) ] =
ρ -n * [ ( cos( - n * θ ) + i * sin( - n * θ ) ]
CQFD

complexe-puissance-negative.png

Le graphique ci-contre illustre géométriquement la forme polaire de la puissance négative d'un nombre complexe.

Inverse et quotient de complexe. Il découle de n_complexe-puissance-polaire que :
1/z = 1/ρ * ( cos( - θ ) + i * sin( - θ )

z1 / z2 = z1 * ( 1 / z2 ) = ρ1 / ρ2 * [ cos( θ1 - θ2 ) + i * sin( θ1 - θ2 ) ]

triangle-clipedia.png Vidéo Clipedia : Racines des nombres complexes
Racines de
complexe

Nous avons vu que n_complexe-puissance-polaire est vérifiée pour n'importe quel nombre n entier. Mais est-ce encore le cas si n est fractionnaire c-à-d si n ∈ ℝ ? La réponse est négative : n_complexe-puissance-polaire doit être complétée pour vérifier ce cas.

Pour être mathématiquement rigoureux, il faut préciser que m/n est un nombre rationnel (m et n sont des entiers) or les réels comprennent également les nombres irrationnels (qui ne peuvent s'écrire sous la forme d'une fraction).

En raison de la périodicité des fonctions cosinus et sinus, l'argument d'un complexe est toujours défini à un multiple (k) de 360° c-à-d de 2*π rad près. Il en va donc de même pour le complexe lui-même :
ρ * [ cos(θ) + i * sin(θ) ] = ρ * [ cos( θ + k * 2 * π ) + i * sin( θ + k * 2 * π )]
k est un entier (k ∈ ℤ).

Cela est sans effet sur n_complexe-puissance-polaire tant que n est entier, mais plus si on le remplace par 1/n car alors on obtient un nombre non entier (k/n) de tours 2*π. Il faut donc le mentionner dans n_complexe-puissance-polaire pour obtenir la totalité des racines :

[ ρ * ( cos(θ) + i * sin(θ) ] 1/n = ρ 1/n * ( cos( θ / n + k / n * 2 * π ) + i * sin( θ + k / n * 2 * π )
k { 0, 1, 2, ..., n-1 }

complexe-racines.png

Un nombre complexe possède donc n racines n-ièmes distinctes qui correspondent à n valeurs successives de k, comprises entre 0 et n−1. Ces racines sont situées sur le même cercle de rayon ρ1/n et centré sur l'origine. On a bien que 2*π/n est l'écart angulaire entre les arguments des racines, de sorte que la somme des angles ouverts par chaque racine forme .

En voici trois exemples.

complexe-racines-exple.png

Analyse combinatoire

https://jortay.net/savoir-de-base#analyse-combinatoire
Dénombrement

Exemple 1. Dans un pays dont les numéros de plaques minéralogiques sont de type "3 lettres + 3 chiffres", pour déterminer le nombre total de plaques de ce type il faut multiplier entre eux le nombre de cas possibles : 26 * 26 * 26 * 10 * 10 * 10 = 17.576.000.

Le théorème fondamental du dénombrement, ou "principe de multiplication" se formule donc simplement par 1pni

Ce principe est simple, et pourtant les exercices de dénombrement ne le sont pas toujours. Il importe :

  1. d'identifier le nombre correct de facteurs, c-à-d la valeur de p (# opérations possibles) ;
  2. d'attribuer la valeur correcte à chaque facteur, c-à-d chaque ni (# résultats possibles par opération).

La valeur d'un ni varie selon que les résultats des opérations sont :

  • (in)dépendants : dans le cas ci-dessus (plaques minéralogiques) les possibilités sont indépendantes, mais si on impose que les lettres doivent être différentes alors il n'y a plus indépendance puisque le choix de la première lettre diminuera le nombre de possibilités pour la seconde et la troisième, et que le choix de la seconde diminuera à nouveau le nombre de choix pour la troisième ⇒ le nombre de cas possible devient : 26 * 25 * 24 * 10 * 10 * 10 = 15.600.000.
  • ordonnées ou pas : la formule n_denombrement prend en compte l'ordre d'arrangement c-à-d compte comme deux possibilités différentes AB et BA (par exemple).

    arrangements.png
    Exemple 2. Le tableau ci-contre montre qu'en recensant (par inversions et distributions) le nombre de combinaisons de quatre lettres (sans répétition d'une même lettre), on obtient un total de 12 ; ce nombre correspond bien à ce que l'on trouve par n_denombrement :
    # opérations (choisir une lettre puis une seconde) : p=2 ;
    # résultats possibles par opération : { n1=4 ; n2=3 } ;
    ⇒ ∏1pni = 4 * 3 = 12

    Dans ce dernier cas si on relâche la contrainte de non répétition, on ajoute alors quatre cas possibles (AA,BB,CC,DD) ⇒ 12+4=16, ce qui correspond bien à :
    # résultats possibles par opération : { n1=4 ; n2=4 } ;
    ⇒ ∏1pni = 4 * 4 = 16

Un autre exemple de dénombrement où l'ordre compte : si parmi dix compétiteurs on tire au sort les médailles d'or, d'argent et de bronze :
# opérations (tirages) : p=3 ;
# résultats possibles par opération : { n1=10 ; n2=9 : n3==8} ;
⇒ ∏1pni = 10 * 9 * 8 = 720

Arrangement

L'arrangement est un cas particulier de dénombrement où l'ordre compte. On le note An1p ou plus simplement Anp (A103 dans le dernier exemple ci-dessus), que l'on peut interpréter par « parmi n je prends p, et l'ordre compte » (NB : se lit "A n p").

On peut généraliser sa formulation comme suit :
Anp = n * (n - 1 ) * ( n - 2 ) * ... * ( n - p + 1 )    ⇔
où les premiers facteurs montrent bien que le nombre de résultats par opération vaut bien n moins le numéro de l'opération plus 1
Anp = n * (n - 1 ) * ( n - 2 ) * ... * ( n - p + 1 ) * [ ( n - p ) * ( n - p - 1) * ... * 1 ] / [ ( n - p ) * ( n - p - 1) * ... * 1 ]   ⇔
Anp = n ! / ( n - p ) !

NB : on retrouve 1pni n_denombrement en posant p=n (puisque 0!=1 par définition).

Suites mathématiques

https://jortay.net/savoir-de-base#suites-mathematiques

Nous allons étudier ici les suite arithmétiques et géométriques.

Suites
arithmétiques

Une suite (u0, ... un) est dite "arithmétique" si ui = ui-1 + r ∀ i
où r est une valeur constante appelée "raison" de la suite.

Indice. On souhaite que l'indice d'un élément quelconque de la suite (le i de ui) représente le nombre d'intervalles entre lui et le premier éléments. C'est pourquoi l'on fixe à zéro l'indice du premier élément d'une suite. Il en résulte que l'indice du dernier élément de la suite vaut le nombre d'éléments de la suite moins 1 : trois points a, b et c déterminent bien deux distances |a-b| et |b-c| c-à-d 3-1, que l'on peut généraliser à n-1 pour un nombre arbitraire de points.

Ce principe d'indiçage vaut également pour les suites géométriques.

Graphe. Graphiquement une suite arithmétique se traduit par une droite, et c'est pourquoi l'on parle indifféremment de progression arithmétique ou linéaire [tableur].

Valeur d'un terme quelconque
Un première propriété de la suite arithmétique est que l'on peut calculer la valeur de n'importe lequel de ses termes (un) à partir de son indice (n), de la valeur du premier terme (u0) et de la raison (r) :
un = u0 + n * r
Démonstration à partir de suite-arithmetique :
un = un-1 + r ⇔
un = (un-2 + r ) + r = un-2 + 2 * r    ⇒
que l'on peut généraliser en remplaçant 2 par n :
un = un-n + n * r    ⇔
un = u0 + n * r    ⇔
CQFD

Valeur de la somme des termes
Par n_suite-arithm-valeur-terme :
i=0n   ui = ∑i=0n   ( u0 + i * r )    ⇔
i=0n   ui = ( n + 1 ) * u0 + r * i=0n   i
Or l'on démontre que :
i=0n   i = n * ( n + 1 ) / 2
en constatant que si :
• I = (0, 1, 2, 3, ..., n-1, n)
• I' = (n, n-1, ..., 3, 2, 1, 0)    ⇒
I + I' = ( U0=n, U1=n, U3=n, ..., Un=n )    ⇔
2 * S(I) = n * ( n + 1 )    ⇔
S(I) = n * ( n + 1 ) / 2    ⇒
i=0n   ui = ( n + 1 ) * u0 + r * n * ( n + 1 ) / 2    ⇔
i=0n   ui = ( n + 1 ) * ( u0 + r * n / 2 )
Ainsi l'on peut calculer la somme d'une suite arithmétique à partir du nombre de ses éléments (n+1), de la valeur du premier élement (u0) et de la raison (r).

On peut également exprimer la somme des termes en fonction de la moyenne :
un = u0 + n * r    ⇔
n * r / 2 = ( un - u0 ) / 2    ⇒
i=0n   ui = ( n + 1 ) * [ u0 + ( un - u0 ) / 2 ]    ⇔
i=0n   ui = ( n + 1 ) * (u0 + un ) / 2    ⇔
i=0n   ui = ( n + 1 ) * Sn

triangle-clipedia.png Vidéo Clipedia : Les suites géométriques
Suites
géométriques

Une suite (u0, ... un) est dite "géométrique" si ui = ui-1 * r ∀ i
où r est une valeur constante appelée "raison" de la suite.

suite-geom.png

Graphe. Graphiquement une suite géométrique se traduit par une exponentielle, et c'est pourquoi l'on parle indifféremment de progression géométrique ou exponentielle [tableur].

Valeur d'un terme quelconque
Un première propriété de la suite géométrique est que l'on peut calculer la valeur de n'importe lequel de ses termes (un) à partir de son indice (n), de la valeur du premier terme (u0) et de la raison (r) :
un = u0 * r n
Démonstration à partir de suite-geometrique :
un = un-1 * r ⇔
un = (un-2 * r ) * r = xn-2 * r 2    ⇒
que l'on peut généraliser en remplaçant 2 par n :
un = un-n * r n
un = u0 * r n
CQFD

Valeur de la somme des termes
Par n_suite-geom-valeur-terme :
i=0n   ui = ∑i=0n   ( u0 * r i )    ⇔
i=0n   ui - r * ∑i=0n   ui = ∑i=0n   ( u0 * r i ) - r * ∑i=0n   ( u0 * r i )    ⇔
i=0n   ui * ( 1 - r ) = ∑i=0n   ( u0 * r i ) - ∑i=0n   ( u0 * r i+1 )    ⇔
i=0n   ui * ( 1 - r ) = u0 * ( ∑i=0n   r i - ∑i=0n    r i+1 )    ⇔
Technique (artifice mathématique) dit de la "somme téléscopique".
i=0n   ui * ( 1 - r ) = u0 * ( 1 - r n+1 )    ⇔
i=0n   ui = u0 * ( 1 - r n+1 ) / ( 1 - r )
Ainsi l'on peut calculer la somme d'une suite géométrique à partir du nombre de ses éléments (n+1), de la valeur du premier élement (u0) et de la raison (r).

suite-geom-raison-negative.png

Raison négative. Si le cas de r<0 est trivial dans le cas d'une suite arithmétique (droite à pente négative) , ce ne l'est plus dans celui d'une suite géométrique car le signe des termes y alterne constamment : c'est alors une oscillation exponentielle que l'on constate (indécelable au début) [tableur].

Problème. Supposons un nénuphar doublant de taille chaque jour, de telle sorte qu'il recouvre la totalité du lac en 365 jours. Après combien de temps a-t-il rempli la moitié du lac ?

Résolution :
Il double de taille chaque jour : r = 2.
Il recouvre la totalité du lac en 365 jours : u365 = 2365 par n_suite-geom-valeur-terme.
⇒ de même, le nombre n de jours après lesquels le lac est à moitié recouvert est tel que :
2365 / 2 = 2 n    ⇔
n = log2(2365 / 2)   ⇔
n = log2(2365) - log2(2)   ⇔
n = 365 - 1 = 364
NB : on peut arriver à ce résultat par un raisonnement plus intuitif : comme la totalité du lac est couverte en i=365 et que la surface double chaque jour, la moitié du lac a donc été couverte en i=365-1 ...

Nous avons vu que les fonctions logarithme et exponentielle sont réciproques n_exp-log-reciproques, de sorte que si l'on applique un affichage logarithmique à une courbe exponentielle on obtient une droite [tableur]. Cela est vrai également dans le cas d'une raison négative, c-à-d d'une sismoïde exponentielle puisqu'il n'y a pas de valeur pour le logarithme d'un nombre négatif (sauf si l'on recourt aux nombres imaginaires).

Résumé

Le tableau suivant permet de comparer les formules des suites mathématiques selon leur type arithmétique ou géométrique.

DéfinitionTerme n∑ termes
Arithm.ui = ui-1 + run = u0 + n * ri=0n   ui = ( n + 1 ) * ( u0 + r * n / 2 )
Géom.ui = ui-1 * run = u0 * r ni=0n   ui = u0 * ( 1 - r n+1 ) / ( 1 - r )
Démonstration
par récurrence

Pour démontrer n_somme-suite-arithmetique nous avions du démontrer que i=0n   i = n * ( n + 1 ) / 2, et pour ce faire nous avions eu recours à un développement mathématique basé sur un artifice mathématique (I+I'). Voici une autre démonstration, qui contrairement à la démonstration par développement requiert d'utiliser la proposition dans sa démonstration (donc de la connaître a priori), mais qui présente l'avantage d'être fondée sur une méthode applicable à de nombreuses démonstrations : la démonstration par récurrence.

Cette technique est composée de deux étapes pour démontrer une proposition P(n)n :

  1. initialisation : démontrer P(0) ;
  2. hérédité : démontrer P(n) ⇒ P(n+1) en partant de P(n+1) et en y faisant apparaître P(n) ;

    Il faut démontrer également P(n) ⇒ P(n-1) si on ne se limite pas aux nombres naturels et que l'on considère le cas des entiers (ℤ).

  3. P(n) est démontré ∀ n

On peut donc distinguer au moins deux types de démonstrations mathématiques :

  • par développement : quand on ne connaît pas a priori la proposition à développer (c-à-d qu'on ne peut l'utiliser dans le cadre de la démonstration) ;
  • par récurrence : on utilise la proposition P(n) dans sa démonstration, qui consiste à démontrer que P(n) est valable ∀ n.

Alors allons-y : soit Sn = 0 + 1 + 2 + 3 + ... + nP(n) ≡ Sn = n * ( n + 1 ) / 2 :

  1. S0 = 0
    et
    0 * ( 0 + 1 ) / 2 = 0
    P(0) ≡ S0 = 0 * ( 0 + 1 ) / 2 est démontré.
  2. Sn+1 = 0 + 1 + 2 + ... + n + ( n + 1 )    ⇔ par P(n) :
    Sn+1 = Sn + ( n + 1 )    ⇔
    Sn+1 = n * ( n + 1 ) / 2 + ( n + 1 )    ⇔
    Sn+1 = ( n + 1 ) * ( n / 2 + 1 )    ⇔
    Sn+1 = ( n + 1 ) * ( n + 2 ) / 2
    Pn ⇒ Pn+1 est démontré.
  3. P(n) ≡ Sn = n * ( n + 1 ) / 2 est démontré ∀ n !

N.B. La démonstration par récurrence peut être utilisée dans d'autres cas que les suites mathématiques. Démontrons ainsi P(n) ≡ d(x n) / dx = n * x n-1 n_dfn(x)/dx :

  1. par n_exposant-zero :
    d(x0) / dx = 0
    et d'autre part :
    n * x-1 = 0
    P(0) ≡ d(x0) / dx = 0 * x -1 est démontré.
  2. d(xn+1) / dx = d(xn * x ) / dx    ⇔ par n_d(f*g)/dx :
    d(xn+1) / dx = d(xn) / dx * x + xn * dx/dx    ⇔ par P(n) :
    d(xn+1) / dx = n * x n-1 * x + xn   ⇔
    d(xn+1) / dx = ( n + 1 ) * x n    ⇔
    Pn ⇒ Pn+1 est démontré.
  3. P(n) ≡ d(x n) / dx = n * x n-1 est démontré ∀ n !

Fonction exponentielle

https://jortay.net/savoir-de-base#exponentielle
triangle-clipedia.png Vidéo Clipedia : La fonction exponentielle

La fonction exponentielle est illustrée ici par le phénomène biologique de division cellulaire de bactéries par fission binaire. La durée d'une fission, appelé temps de génération (TG), se situe en 15 minutes et quelques heures.

Cette fonction est f(x) = 2xx est le nombre de générations.

Pour illustrer la dynamique de la multiplication exponentielle on va mesurer l'espace pris après 24 heures par la multiplication de la bactérie "Escherichia coli", qui constitue 80% de notre flore intestinale (mais dont certaines souches sont pathogènes pour les intestins). Sa taille est environ 2*0,5 µm ("microns") ⇒ sa surface est de 1 µm2 = 10-12 m2 (invisible au microscope optique).

Soit TG=16min ⇒ le nombre de générations après 24 heures est de 24*60/16=90 ⇒ le nombre de bactéries est alors 290=1,24*1027 ⇒ elles occupent une surface de 1,24*1027*10-12 m2=1,24*1015 m2 ... soit plus du double de la surface de la Terre (0,51*1015 m2) ! Ainsi puisque chaque génération double le nombre total de cellules, il en résulte que l'augmentation de surface entre les 89° et 90° générations équivaut à la surface de la Terre ! La croissance exponentielle est donc un phénomène qu'il n'est pas facile d'appréhender intuitivement.

On généralise la formulation de l'exponentielle par f(x) = bx, où b est la "base" de la fonction exponentielle.

NB : la fonction est dite "exponentielle" car la variable x est mise à l'exposant. Pour faciliter la notation ex est parfois écrite exp(x).

On peut étudier formellement la dynamique de la fonction exponentielle en calculant sa dérivée :
f '(x) = ( f ( x + dx ) - f (x) ) / dx n_derivee   ⇒
(2x)' = ( 2( x + dx ) - 2x ) / dx    ⇔ par n_produit-de-puissances :
(2x)' = ( 2x * 2dx - 2x ) / dx    ⇔
(2x)' = 2x * ( 2dx - 1 ) / dx

( 2dx - 1 ) / dx = 0/0    ⇒
pour lever l'indétermination on va tester des petites valeurs de x :
• si dx=0,01 ⇒ ( 2dx - 1 ) / dx = 0,695...
• si dx=0,001 ⇒ ( 2dx - 1 ) / dx = 0,693...
• si dx=0,0001 ⇒ ( 2dx - 1 ) / dx = 0,693...    ⇒
(2x)' = 2x * 0,693
où 0,693 est donc la valeur de la pente de la fonction 2x à l'origine c-à-d pour x=0 : (2x)'|x=0 = 0,693.
Interprétation : le taux de croissance de la fonction exponentielle est lui-même une fonction exponentielle ⇒ on comprend mieux maintenant l'impressionnante croissance spatiale de la division cellulaire.

triangle-clipedia.png Vidéo Clipedia : Le nombre "e"
exponentielle.png

De même on pourra calculer que :
(10x)' = 10x * 2,303 ⇒ (10x)'|x=0 = 2,303

Exponentielle naturelle. On va alors calculer la valeur (appelons-là e) de la base b, correspondant à une pente unitaire à l'origine de la fonction ex (dite exponentielle "naturelle"), c-à-d telle que :
(ex)' = ex * ( edx - 1 ) / dx = ex
e est donc telle que la dérivée de la fonction ex est égale à cette même fonction !

Pour ce faire on va à nouveau procéder par essais-erreurs en partant de b=2 :
• si b=2,5 ⇒ (2,5x)'|x=0 = 0,916  ⇒ je peux encore augmenter la base :
• si b=3 ⇒ (3x)'|x=0 = 1,098  ⇒ je dois diminuer la base :
• si b=2,7 ⇒ (2,7x)'|x=0 = 0,993  ⇒ je dois augmenter la base :
• si b=2,72 ⇒ (2,72x)'|x=0 = 1,001  etc... ⇒
e=2,718282..

exponentielle-naturelle.png

Logarithme naturel. Nous avons vu dans la section consacrée à la fonction logarithme que celle-ci est réciproque de la fonction exponentielle (et réciproquement) :
f(x) = e x   ⇔   loge (e x) ≡ ln (e x) = x n_log-def-longue
b = e ln(b) n_exp-log-reciproques
de sorte que l'on peut exprimer une exponentielle de base quelconque comme une exponentielle de base e :
bx = ( e ln(b) ) x   ⇔    par n_puissance-de-puissance :
bx = e ln(b) * x   ⇒
( bx ) ' = ( e ln(b) * x ) '   ⇔    par n_derivee-fonction-composee :
( bx ) ' = d( e ln(b) * x ) / d( ln(b) * x ) * d(ln(b) * x) / dx   ⇔    par exponentielle-naturelle :
( bx ) ' = e ln(b) * x * ln(b)   ⇒
soit ln(b) = a    ⇒
( e a * x ) ' = a * e a * x
qui est une d'équation différentielle de type f '(x) = a * f(x), qui permet de décrire de nombreux phénomènes physiques où biologiques dont la variation est proportionnelle à la grandeur elle-même,et dont la solution est de type exponentielle.

expo-asymptote

Analyse géométrique. La fonction exponentielle est asymptotique (à l'axe horizontal ) pour x --> - ∞ mais il n'y a pas de tendance asymptotique pour x --> + ∞ puisque x doit augmenter infiniment pour que ex augmente infiniment.

La méthode appliquée supra pour calculer la valeur de e est grossière. La méthode d'Euler permet de calculer facilement cette valeur, avec une précision arbitraire. Elle repose sur le fait qu'aucune autre fonction que f(x)=ex est telle que f(x)'=f(x). Elle consiste à utiliser une fonction f(x) que l'on fait progressivement approcher de ex :

exponentielle-decomposition.png

Étape 1. On commence avec l'équation de la tangente de ex à l'origine. :
f(x) = 1 + x
qui est telle que :
limx→0 1 + x = ex

Étape 2. On complète f(x) pour en faire polynôme du second degré :
f(x) = 1 + x + a * x2
⇒ on calcule la valeur de a telle que f(x) vérifie la propriété caractéristique de l'exponentielle c-à-d telle que :
f(x)' = f(x)    ⇒
( 1 + x + a * x2 )' = 1 + x + a * x2    ⇔
1 + 2 * a * x = 1 + x + a * x2    ⇔
a = 1 / ( 2 + x )
or :
limx→0 1 / ( 2 + x ) = 1/2
⇒ on pose a=1/2 ⇒ :
f(x) = 1 + x + 1/2 * x2

Étape 3. On complète f(x) pour en faire un polynôme du troisième degré :
1 + x + 1/2 * x2 + b * x3    ⇒
on calcule la valeur de b telle que f'(x) = f(x) :
( 1 + x + 1/2 * x2 + b * x3 )' = 1 + x + 1/2 * x2 + b * x3    ⇔
b = 1 / ( 6 - 2 * x )
or :
limx→0 1 / ( 6 - 2 * x ) = 1/6
⇒ on pose b=1/6 ⇒ :
f(x) = 1 + x + 1/2 * x2 + 1/6 * x3    ⇒

Étape 4. On complète f(x) pour en faire un polynôme du quatrième degré :
1 + x + 1/2 * x2 + 1/6 * x3 + c * x4    ⇒
on calcule la valeur de b telle que f'(x) = f(x) :
( 1 + x + 1/2 * x2 + 1/6 * x3 + c * x4 )' = 1 + x + 1/2 * x2 + 1/6 * x3 + c * x4   ⇔
c = 1 / ( 24 - 6 * x )
or :
limx→0 1 / ( 24 - 6 * x ) = 1/24
⇒ on pose c=1/24 ⇒ :
f(x) = 1 + x + 1/2 * x2 + 1/6 * x3 + 1/24 * x4
où l'on constate que les dénominateurs ui des coefficients constituent une suite de type :
ui = i !
i est également le degré polynomial associé au terme de la suite; ou encore le rang du terme dans la suite.

Étape 5. On peut alors, par généralisation à un degré arbitraire n, établir la formulation de f(x) pour une précision arbitraire n :
f(x) = 1/0! + 1/1! * x + 1/2! * x2 + 1/3! * x3 + 1/4! * x4 + ... + 1/n! xn    ⇒
f(x) = ∑n=0    xn / n!

NB : 0!=1 par définition.

On obtient ainsi la décomposition en série entière de la fonction exponentielle :
ex = ∑n=0    xn / n!
⇒ pour calculer la valeur de e il suffit de poser x=1 ⇒
e = ∑n=0    1 / n!    ⇔
e = 1 +1 + 1/2 + 1/6 + 1/24 + ... = 2,71828182846...
Euler a montré qu'il s'agit d'un nombre irrationnel c-à-d ne pouvant être égal au quotient de deux nombres.

Exponentielle
imaginaire

Il peut être utile dans certains calculs de transformer une exponentielle imaginaire de base quelconque b i en exponentielle naturelle e f(i) :
par n_exp-log-reciproques :
b i = ( e ln(b) ) i    ⇔
par n_puissance-de-puissance :
b i = e i * lnb

Plus généralement on souhaite exprimer la fonction :
f(θ) = e i * θ    où θ ∊ ℝ
sous forme de son complexe :
f(θ) = e i * θ = x(θ) + i * y(θ)
⇒ on doit déterminer les fonctions x(θ) et y(θ).

Étape 1 :
par n_module-complexe :
| e i * θ | 2 = e i * θ * e -i * θ    ⇔ par n_produit-de-puissances :
| e i * θ | 2 = e 0    ⇔ par n_exposant-zero :
| e i * θ | 2 = 1
⇔ le graphe de la fonction ex a la forme d'un cercle centré sur l'origine des axes représentant les parties réelle et imaginaire du complexe x(θ) + i * y(θ).

Étape 2. Pour définir l'équation de ce cercle on va calculer sa dérivée :
par n_(ea*x)' :
de i * θ / dθ = i * e i * θ

formule-euler.png
Étape 3. On exprime f(θ) sous forme polaire :
f(θ) = e i * θ = x(θ) + i * y(θ)    ⇔ par n_complexe-polaire :
f(θ) = e i * θ = cos[ φ(θ) ] + i * sin[ φ(θ) ]
⇒ en identifiant φ(θ) on pourra identifier
• x(θ) = cos[ φ(θ) ]
• y(θ) = sin[ φ(θ) ]


Étape 4.
  • On substitue le résultat f(θ) de l'étape 3 dans celui de l'étape 2 ⇒
    de i * θ / dθ = i * e i * θ = i * ( cos[ φ(θ) ] + i * sin[ φ(θ) ] )   ⇒
    de i * θ / dθ = i * e i * θ = i * cos[ φ(θ) ] - sin[ φ(θ) ]
  • On égalise le résultat de l'étape 2 à la dérivée de f(θ) :
    i * e i * θ = [ x(θ) + i * y(θ) ] '    ⇔
    i * e i * θ = x '(θ) + i * y '(θ)    ⇒ par n_sinus et n_cos(a)=x/R :
    i * e i * θ = ( cos[ φ(θ) ] ) ' + i * ( sin[ φ(θ) ] ) '    ⇔ par n_derivee-cos n_derivee-sin n_derivee-fonction-composee :
    i * e i * θ = - sin[ φ(θ) ] ) * φ '(θ) + i * cos[ φ(θ) ] ) * φ '(θ)
  • ⇒ on constate l'égalité des résultats des deux points ci-dessus :
    i * cos[ φ(θ) ] - sin[ φ(θ) ] = - sin[ φ(θ) ] ) * φ '(θ) + i * cos[ φ(θ) ] ) * φ '(θ)    ⇔
    i * cos[ φ(θ) ] - sin[ φ(θ) ] = ( - sin[ φ(θ) ] + i * cos[ φ(θ) ] ) * φ '(θ)    ⇔
    φ '(θ) = 1    ⇒
    φ(θ) = θ + c
    or le graphique montre que si θ=0 ⇒ φ(θ)=0
    ⇒ c = 0 ⇒
    φ(θ) = θ
    φ(θ) est donc tout simplement la fonction identité.
formule-euler-2.png
Étape 5. On injecte le résultat de l'étape 4 dans celui de l'étape 3 :
• x(θ) = cos[ φ(θ) ] = cos(θ)
• y(θ) = sin[ φ(θ) ] = sin(θ)
⇒ la formule d'Euler :
e i * θ = cos(θ) + sin(θ) * i
θ est en radians.
On notera ces valeurs particulières, calculées par partir de n_formule-euler :
• e i * 0 = 1
• e i * π/2 = i
• e i * π = -1  ⇔ e i * π + 1 = 0    ("identité d'Euler")
• e i * 3π/2 = -i

N.B. Le cercle trigonométrique a pour caractéristique que son rayon vaut 1 :
par n_module-complexe :
| e i*θ | = √ ( cos2(θ) + sin2(θ) )    ⇔
par n_sin2(a)+cos2(a)=1 :
| e i*θ | = 1
ce qui implique que θ doit être un nombre réel c-à-d qu'il ne peut être un nombre complexe :
ei*(a+i*b) = ei*a-b = ei*a * e-b
or
| ei*a | = 1    ⇒
| ei*a * e-b | = 1 ⇔ b=0
CQFD

Nous allons maintenant illustrer le fait que e i * θ est la représentation algébrique du cercle trigonométrique.

expo-imagin-illustration1.png

Nous avons vu que :
a i = ( e ln(a) ) i    ⇔
a i = e i * ln(a)
Ainsi le point a i (en noir) correspond à l'angle d'arc-tangente ln(a) (en vert).)

Logarithme imaginaire. Il est alors très facile de calculer ln(i) :
e i * π/2 = cos(π/2) + i * sin(π/2) = i
et d'autre part :
i = eln(i)    ⇒
ln(i) = i * 1/2 * π + i * 2*k*π

On montre de la même manière que :
ln(-i) = i * 3/2 * π + i * 2*k*π
ln(-1) = i * π + i * 2*k*π
N.B. Ce dernier résultat est remarquable : on peut maintenant calculer le logarithme d'un nombre négatif :
ln(-|x|) = ln(-1 * |x| )    ⇔ par n_produit-de-log :
ln(-|x|) = ln(-1) + ln(|x|)    ⇔
ln(-|x|) = ln(|x|) + i * π + i * 2*k*π
qui est un nombre imaginaire dont la partie réelle vaut ln(|x|) et la partie imaginaire vaut π+2*k*π.

Applications. On va maintenant montrer que l'exponentielle imaginaire est très pratique pour représenter les nombres complexes et en étudier les propriétés.

Ainsi l'on va pouvoir démontrer plus simplement certaines propriétés des nombres complexes, à commencer par la formule du produit de complexes n_complexe-produit-polaire : soit :
z = ρ * ( cos(θ) + i * sin(θ) ) ⇒ par n_formule-euler :
z = ρ * e i*θ    ⇒
z1 * z2 = ρ1 * ρ2 * e i*θ1 * e i*θ2   ⇔
z1 * z2 = ρ1 * ρ2 * e i*(θ12)
que l'on peut évidemment généraliser à :
i=1 n zi = ∏i=1 n( ρi ) * e i * ∑i=1 nθi
où n est un nombre entier positif, et dont un cas particulier remarquable est celui de :
ρi = ρ  et  θi = θ  ∀ i ⇒
z n = ρ n * e i * ( n * θ )
• qui est valable pour n < 0    ⇒
    - inverse : 1 / z = 1 / ρ * e i * ( - θ )
    - division : z 1 / z 2 = ρ 1 / ρ 2 * e i * ( θ1 - θ2 )
• qui est aussi valable pour n fractionnaire    ⇒
   - z1/n = ρ 1/n * e i * [ 1/n * (θ+2kπ) ]

La notion d'exponentielle imaginaire facilite également la démonstration de propriétés de fonctions trigonométriques, à commencer par la fonction sin(2*a). Pour ce faire on part de la formule d'Euler :
e i * θ = cos(θ) + sin(θ) * i n_formule-euler
qui nous dit que le cos est la partie réelle du complexe, et le sin sa partie imaginaire :
• cos(θ) = Re[ei*θ]
• sin(θ) = Im[ei*θ]

sin(2a) = Im[ei*2*a]    ⇔ par n_produit-de-puissances :
sin(2a) = Im[ei*a * ei*a]    ⇔
sin(2a) = Im[ ( cos(a) + i * sin(a) ) * ( cos(a) + i * sin(a) ) ]    ⇔
sin(2a) = Im[ cos2(a) - sin2(a) + i * 2 * cos(a) * sin(a) ) ]    ⇔
sin(2a) = 2 * cos(a) * sin(a)    ⇔
CQFD
qui est effectivement plus simple que la démonstration géométrique de n_sin(a+b).

On procède de même pour démontrer :
cos(a+b) = Re[ e i*(a+b) ]    ⇔
cos(a+b) = Re[ e i*a * e i*b ]    ⇔
cos(a+b) = Re[ ( cos(a) + i * sin(a) ) * ( cos(b) + i * sin(b) ) ]    ⇔
cos(a+b) = Re[ cos(a) * cos(b) - sin(a) * sin(b) + i * (...) ]    ⇔
cos(a+b) = cos(a) * cos(b) - sin(a) * sin(b) ]
CQFD Encore une fois on est plus obligé de démontrer géométriquement par des montages sur le cercle trigonométrique, grâce au fait que la fonction exponentielle imaginaire est une représentation mathématique du cercle trigonométrique ⇒ on peut rester dans le domaine de l'algèbre.

Pour terminer on va démontrer :
cos(a) + cos(b) = 2 * cos[ ( a + b ) / 2 ] * cos[ ( a - b ) / 2 ]
en partant du fait que par n_imaginaire-addition :
cos(a) + cos(b) = Re[ e i*a + e i*b ]    ⇔
en appliquant un artifice mathématique :
cos(a) + cos(b) = Re[ e i*(a+b)/2 * ( e i*(a-b)/2 + e - i*(a-b)/2 ) ]
où :
e i*(a-b)/2 + e - i*(a-b)/2
est la somme de deux complexes conjugués.
Or :
e i*a + e -i*a = [ cos(a) + i * sin(a) ] + [ cos(a) + i * sin(a) ] = 2 * cos(a)    ⇔
cos(a) = ( e i*a + e - i*a ) / 2
qui est la définition moderne du cosinus, ou encore que cos(a) est la partie réelle de ei*a !
De la même manière on démontre que :
sin(a) = ( e i*a - e - i*a ) / ( 2 * i )

e i*(a-b)/2 + e - i*(a-b)/2 = 2 * cos[ (a-b) / 2 ]
NB : qui est un nombre réel    ⇒
cos(a) + cos(b) = Re[ e i*(a+b)/2 ] * 2 * cos[ (a-b) / 2 ]    ⇔
cos(a) + cos(b) = cos[ (a+b) / 2 ] * 2 * cos[ (a-b) / 2 ]
CQFD

expo-imagin-applications.png

Cette démonstration aurait été nettement plus difficile à démontrer sans recourir à l'exponentielle imaginaire, ce qui confirme la puissance de celle-ci pour résoudre de nombreux problèmes mathématiques, mais également modéliser de nombreuses applications caractérisées par des variations harmoniques c-à-d sinusoïdales :

  • le nuage électronique qui vibre avec une certaine fréquence (ω dans la formule de l'image ci-contre) ;
  • l'onde que propage le laser ;
  • les variations du courant et de la tension de l'électricité alternative.

Matrices

https://jortay.net/savoir-de-base#matrices
 4.7.1. Définition
 4.7.2. Déterminant et matrice inverse
 4.7.3. Addition matricielle
 4.7.4. Produit matriciel
 4.7.5. Matrice identité
 4.7.6. Transformation
 4.7.7. Plan et volume
 4.7.8. Formule générale du déterminant
 4.7.9. Propriétés du déterminant
 4.7.10. Matrice inverse
 4.7.11. Déterminant d'un produit de matrices
Définition
https://jortay.net/savoir-de-base#matrice-definition
triangle-clipedia.png Vidéo Clipedia : Les matrices : introduction

Les matrices permettent de simplifier le calcul des solutions d'un système d'équations, par exemple le système d'équations linéaire à deux inconnues : x et y

a * x + b * y = p
c * x + d* y = q

dont on constate que les membres de gauche correspondent à des produits scalaires n_F*L=Fx*Lx+Fy*Ly :

(a, b) . (x, y) = p
(c, d) . (x, y) = q

de sorte, par convention, que le système peut être représenté sous forme matricielle comme suit :

ab
cd
*
x
y
=
p
q

dont la règle de calcul est formulée par n_syst-2-equ-lin.

Déterminant et matrice inverse
https://jortay.net/savoir-de-base#matrice-determinant-inverse
Produit
matriciel
basique

En simplifiant l'écriture de la forme matricielle ci-dessus par A * X = P, on définit alors le membre de gauche comme étant un "produit matriciel", et dont la règle de calcul est comme suit :

  • première ligne de P : produit scalaire de la première ligne de A avec la "matrice colonne" X (on dit aussi "vecteur colonne") ;
  • seconde ligne de P : produit scalaire de la deuxième ligne de A avec la colonne de X.

Il résulte de A * X = P que l'on pourrait calculer simultanément l'ensemble des solutions du système par le produit : X = A-1 * P.

Il nous faut donc approfondir la notion de matrice inverse (A-1). Pour ce faire commençons par calculer les solutions de n_syst-2-equ-lin sans recourir aux matrices :

x = d * p − b * q / ( a * d − b * c )
y = a * q − c * p / ( a * d − b * c )

Pour trouver ces solutions rapidement une méthode consiste à multiplier la première équation par le coefficient de y dans la seconde équation (d), puis on multiplie la seconde équation par le coefficient de y dans la première équation (b), enfin on soustrait les deux équations, ce qui donnent la valeur de x. Ensuite on effectue le même type d'opération pour obtenir la valeur de y.

Déterminant de A. On constate que les deux solutions ont même dénominateur : a * d − b * c. On l'appelle "déterminant de A" car si sa valeur est nulle il détermine que x et y sont infinis c-à-d que le système n'a pas d'équation. Il est noté det(A) et l'on constate que sa valeur correspond au produit scalaire des éléments de la diagonale principale (↘) de A par ceux de l'autre diagonale (↙) :

det
ab
cd
= a * d − b * c

Inverse de A. Nous verrons plus loin que la résolution de nombreux calculs d'ingénierie requiert l'utilisation de l'inverse d'une matrice. Or la notion de déterminant va nous permettre de formuler simplement l'inverse d'une matrice.

En effet le système des solutions devient alors :

det(A) * x = d * p − b * q
det(A) * y = a * q − c * p


que l'on ordonne pour symétriser :

det(A) * x = d * p - b * q
det(A) * y = - c * p + a * q


de sorte que les deux membres peuvent être écrits sous forme matricielle :

det(A) * x
det(A) * y
=
d-b
-ca
*
p
q

On met alors det(A) en évidence puis on le fait passer dans le membre de droite, de sorte que l'on obtient la forme matricielle du système des solutions du système produit-matriciel-base :

x
y
= 1 / det(A) *
d-b
-ca
*
p
q


que l'on compare à :
X = A-1 * P
pour en déduire que :

A-1 = 1 / det(A) *
d-b
-ca


Où l'on notera que la matrice ressemble quelque peu à A, sauf que :
• les éléments que la diagonale principale sont intervertis ;
• les éléments que la diagonale secondaire ont changé de signe.

Et l'on a bien que :
A * X = P  ⇒  X = A-1 * P

Addition matricielle
https://jortay.net/savoir-de-base#matrice-addition

La comparaison de n_syst-2-equ-lin et produit-matriciel-base montre que le produit d'une matrice par un scalaire, ainsi que l'addition de matrices, s'opèrent en appliquant élément par élément de matrice les principes du produit et de l'addition de scalaires. On comprend également que ne peuvent être additionnées que des matrices de dimensions #lignes x #colonnes égales.

Notation. Dans les indices de matrices le premier chiffre indique le nombre de lignes, et le second le nombre de colonnes. Ainsi la matrice Amxn est de dimension mxn c-à-d est composée de m lignes et n colonnes (NB : mxn est donc le nombre d'éléments de la matrice). Dans le cas des opérations d'algèbre matricielle on utilise une notation en fonction des éléments aij :

Amxn =
a11a12...a1n
a21a22...a2n
............
am1am2...amxn
= (aij)

où :
i=1,...,m : indique la ligne de l'élément aij;
j=1,...,n : indique la colonne de l'élément aij.

Ainsi l'on démontre facilement la distributivité de la multiplication scalaire sur l’addition de matrices :
α * [ A + B ] =
α * [ (aij) + (bij) ] =
α * ( aij + bij ) =
[ α * ( aij + bij ) ] =
( α * aij + α * bij ) =
( α * aij ) + ( α * bij ) =
α * ( aij ) + α * ( bij ) =
α * A + α * B
CQFD

On démontre de la même manière :

  • l'associativité de l’addition de matrices : [A+B]+C=A+[B+C]
  • la commutativité de l’addition de matrices : A+B=B+A
Application

Une matrice constitue un outil mathématique idéal pour représenter et modifier une image numérique :

  • chaque élément de la matrice correspond à un point de l'image (pixel) ;
  • la valeur de chaque élément correspond à l’intensité lumineuse du point correspondant ;
  • la dimension de la matrice correspond à celle de l'image.

Ainsi dans le cas simple d’une image monochrome :

  • la matrice nulle, c-à-d ne comportant que des zéros, correspond à une image noire ⇔ la somme d’une image quelconque avec une image noire redonne l’image de départ, et pas une image noire ;
  • on créé un effet de fondu (superposer deux images) en additionnant les matrices correspondant à ces images ;
  • on modifie la luminosité d'une image en multipliant sa matrice par un scalaire.
Produit matriciel
https://jortay.net/savoir-de-base#matrice-produit

Nous disposons maintenant des éléments nécessaires pour définir le produit matriciel général. On peut le faire facilement à partir du produit de deux matrices carrées, que l'on détermine comme suit :

ab
cd
*
ef
gh
*
x
y
 =

par la correspondance entre n_syst-2-equ-lin et produit-matriciel-base

ab
cd
*
e * x + f * y
g * x + h *y
 =

a * ( e * x + f * y ) + b * ( g * x + h *y )
c * ( e * x + f * y ) + d * ( g * x + h *y )
 =

( a * e + b * g ) * x + ( a * f + b * h ) * y
( c * e + d * g ) * x + ( c * f + d * h ) * y
 =

par la correspondance entre n_syst-2-equ-lin et produit-matriciel-base

a * e + b * ga * f + b * h
c * e + d * g c * f + d * h
*
x
y


⇒ par comparaison avec la première égalité :

ab
cd
*
ef
gh
=
a * e + b * ga * f + b * h
c * e + d * g c * f + d * h

où l'on constate que l'élément i j de la matrice produit C=A*B est égal au produit scalaire de la ligne i de A par la colonne j de B, ce que l'on formule mathématiquement comme suit :
c i j = a i 1 * b 1 j + a i 2 * b 2 j = ∑k=12a i k * b k j

Et l'on voit que cette formule vaut également pour des matrices A et B de dimensions n :

c i j = a i 1 * b 1 j + ... + a i n * b n j = ∑ k=1na i k * b k j.

... pourvu que le nombre de colonnes de A soit égal au nombre de lignes de B (car sans cette propriété il n'y a pas de produit scalaire possible) : A pxn * B nxq = C pxq .

Application. Il suffit des quatre lignes de code suivantes pour programmer la transcription informatique du dernier membre de la formule mathématique n_produit-matriciel. Cet algorithme permet à un ordinateur de calculer en quelques secondes une matrice produit scalaire comportant des millions d'éléments :

// Pour chaque ligne de la matrice produit Cpxq :
for (i=0;i<p;i++)
	// et pour chaque colonne de la matrice produit C mxn :
	for (j=0;j<q;j++)
		// le  produit scalaire ligne * colonne s'effectue :
		for (k=0;k<n;k++)
			// en  cumulant les produits des éléments homologues :
			c[i][j]+=a[i][k]*b[k][j];

Notez la similitude entre la dernière ligne de l'algorithme et le dernier membre de n_produit-matriciel.

Matrice 1x1. On notera qu'une matrice 1x1 n'est pas un scalaire :
(c11) = C1x1 = A1xn * Bnx1 =

a11a12...ann
*
b11
b21
...
b2n
=
(c11 = ∑ k=1na i k * b k j)
qui est donc une matrice ne contenant qu'un seul élément, mais qu'il ne faut pas confondre avec le scalaire c11 ! Ainsi la multiplication d'une matrice quelconque ( dij ) par un scalaire est toujours possible :
c11 * ( dij ) = ( c11 * dij )
mais ce n'est pas le cas du produit de cette matrice quelconque par une matrice C1x1=( c11 ) :
( c11 ) * ( dij )
qui n'est n'est possible que si i=1

À noter également que si l'on commute les matrices du produit :
A1xn * Bnx1 = C1x1
on obtient :
Bnx1 * A1xn = Cnxn
qui est donc une matrice nxn !

b11
b21
...
b2n
*
a11a12...a1n
=

b11*a11...b11*a1n
.........
b2n*a11...b2n*a1n

Propriétés du produit matriciel :

  • Non commutativité :
    Soit
    A lxn * B nxm = C lxm
    alors
    B nxm * A lxn
    n'est possible que si m=l, et dont une condition nécessaire (mais non suffisante) de commutativité est que m=l=n, de sorte que les deux matrices doivent être carrées et de dimensions égales ⇒ le produit matriciel n'est donc pas commutatif en toute généralité. CQFD.
  • Distributivité de la multiplication matricielle sur l’addition matricielle :
    A * ( B + C ) =
    (aik) * [ (bkj) + (ckj) ] =
    (aik) * ( bkj + ckj ) =
    par n_produit-matriciel :
    ( ∑ k=1na i k * ( bkj + ckj ) ) =
    par distributivité entre scalaires, puis regroupements b et c :
    ( ∑ k=1na i k * bkj + ∑ k=1na i k * ckj ) =
    ( ∑ k=1na i k * bkj ) + ( ∑ k=1na i k * ckj ) =
    A * B + A * C
    CQFD
  • Associativité :
    (A * B ) * C =
    [ (ail) * (blk) ] * (ckj) =
    ( ∑l a il * b lk ) * (ckj) =
    ( ∑k [ ∑l a il * b lk ] * ckj ) =
    ( ∑k [ ∑l a il * b lk * ckj ] ) =
    par commutativité de la somme :
    ( ∑l [ ∑k a il * b lk * ckj ] ) =
    mise en évidence de a il :
    ( ∑l [ a il * [ ∑k b lk * ckj ] ] ) =
    ( a il ) * ( ∑k b lk * ckj ) =
    ( a il ) * [ ( b lk ) * ( ckj ) ] =
    A * ( B * C )
    CQFD
Matrice identité
https://jortay.net/savoir-de-base#matrice-identite
Soit la matrice A =
ab
cd
. On appelle "matrice identité" la matrice I = A-1 * A.

On calcule sa valeur comme suit :

A-1 * A =
par n_matrice-inverse :
1 / det(A) *
d-b
-ca
*
ab
cd
=

1 / det(A) *
a * d - b * c0
0a * d - b * c


par n_determinant :

I =
10
01

Que l'on peut généraliser au cas d'une matrice carrée quelconque nxn :

I = (ipq)   où   ipq = 0 si p≠q
1 si p=q


et que l'on démontre comme suit :
A * I =
(aik) * (ikj) =
par n_produit-matriciel
( ∑k=12a i k * i k j ) =
par définition n_matrice-identite :
( ∑k=12a 1i * i 1j + a 2i * i 2j +... + a ij * i jj + ... + a in * i nj) =
où tous les i sont nuls sauf i jj=1 ⇒
(aij) = A
CQFD (même principe pour I*A )

On démontre facilement qu'une matrice identité est nécessairement carrée, à partir de l'égalité :
I lxn * A nxm = A lxm
qui n'est possible pour A que si n=l
CQFD

Nous sommes maintenant en mesure de démontrer une quatrième propriété du produit matriciel : [A * B]−1 = B−1 * A−1
que l'on démontre en commençant par montrer que :
A * B * B−1 * A−1 =
A * A−1 = I
⇒ si on multiplie par [A * B]−1 les deux membres extrêmes de cette chaîne d'égalités    ⇒
[A * B]−1 * B * A * B−1 * A−1 = [A * B]−1    ⇒
B−1 * A−1 = [A * B]−1
CQFD

Transformation
https://jortay.net/savoir-de-base#matrice-transformation
triangle-clipedia.png Vidéo Clipedia : Matrices et transformations

Nous allons voir ici que la notion de transformation est une application des matrices de dimension nxn (donc carrées). Nous allons étudier ici la transformation d'une image par transformation de ses coordonnées : X'2x1 = A2x2 * X2x1 où les vecteurs colonnes X et X' sont les vecteurs positions d'un pixel dans chacune des images, et A2x2 est la matrice de transformation.

Ainsi la symétrie axiale d'axe y d'une image (cf. graphique infra) peut s'écrire :

x' = -x
y' = y


x'
y'
=
-10
01
*
x
y

Symétrie axiale d'axe Y

symetrie-axe-Y.png

De même que n’importe quelle matrice carrée 2×2 peut être considérée comme une transformation d’image (ou encore comme une transformation du plan), plus généralement, une matrice carrée 3×3 peut être considérée comme une transformation d’objet à trois dimensions (transformation de volume).

Nous allons maintenant étudier quelques propriétés remarquables de transformations matricielles.

Réversion
La première propriété est particulièrement intuitive : l'inverse d'une matrice transformation est la matrice de la transformation inverse (on dit aussi "réciproque") :
X’ = A * X    ⇔
A−1 * X’ = A−1 * A * X    ⇔
A−1 * X’ = X
CQFD

NB : il résulte de n_matrice-inverse qu'une transformation dont le déterminant est nul est par conséquent non réversible (dans le cas des transformations d'image, on dit que l'information sur l'image originelle a été perdue lors de la transformation).

Matrice égale à son inverse :
à l'instar des scalaires :
A = A−1   ⇔   A2 = I
mais contrairement aux scalaires il n'y pas seulement A=I et A=-I comme solutions : il existe une infinité de matrices ayant pour propriété d'être égale à leur inverse. C'est par exemple le cas de la matrice telle que :

-1α
01
*
-1α
01
=
10
01

Transformations
multiples

La matrice B * A est la matrice d’une seule transformation équivalente à la transformation B appliquée à la transformation A :
X" = B * X' = B * A * X
À noter que l'ordre des transformations est l'inverse de celui de leur écriture formelle du produit, ce qu'il importe de ne pas perdre de vue dès lors qu'un produit matriciel n'est pas nécessairement commutatif (il l'est cependant dans certains cas, comme par exemple si la transformation par A est une symétrie axiale d'axe Y, et la transformation par B une symétrie axiale d'axe X).

Vecteurs
unitaires
transformés
Pour analyser plus en profondeur le principe de transformation, on va identifier la transformation des points de coordonnées (1, 0) et (0, 1), qui sont les coordonnées des vecteurs de base unitaires :

1x =
1
0
   et    1y =
0
1
    dans les directions x et y.

Les vecteurs transformés sont :

ab
cd
*
1
0
=
a
c


et

ab
cd
*
0
1
=
b
d

Où l'on voit que les colonnes successives de la matrice transformation carrée représentent des vecteurs qui sont les transformées de chacun des vecteurs de base .

Ainsi l'on comprend, plus intuitivement, que par exemple la matrice
α0
01
    a pour effet de modifier la largeur de l'image.
elargir.png
Rotation

Dans le cas d'une rotation d'un angle θ les figures suivantes illustrent le vecteur 1x et sa transformation (deux figures de gauche : représentation vectorielle et sa transformée en représentation cartésienne), puis le vecteur 1y et sa transformation (deux figures de droite : représentation vectorielle et sa transformée en représentation cartésienne)

:
matrice-rotation.png
Par conséquent :

matrice-rotation-x.png
1'x =
a
c
=
cos θ
sin θ

matrice-rotation-y.png
1'y =
b
d
=
- sin θ
- cos θ


de sorte que :

ab
cd
=
cos θ- sin θ
sin θcos θ

D'où il résulte que le déterminant d'une rotation vaut 1 :
det(A) = a * d - b * c = (cosθ)2 + (sinθ)2    ⇔ par n_sin2(a)+cos2(a)=1 :
det(A) = 1
CQFD

Plan et volume
https://jortay.net/savoir-de-base#matrice-2D-3D

Le lecteur attentif aura remarqué que l'interprétation d'une matrice comme expression d'une transformation correspond à un changement de notation dans le système d'équations n_syst-2-equ-lin où les constante p et q ont été remplacées par la coordonnée (x', y') du point transformé ⇒

a * x + b * y = x'
c * x + d* y = y'

transformation-surface.png

2D

On constate qu'un segment de droite avant transformation reste un segment de droite après une telle transformation, mais en général d’orientation et de longueur différentes. En particulier le segment déterminé par les points (0,0) et (1,1), c-à-d le vecteur position (1,1), est transformé en vecteur position (a+b,c+d). Ainsi le carré unitaire est transformé en parallélogramme.

ab
cd
*
1
1
=
a+b
c+d

On peut montrer de diverses façon que le déterminant de la matrice de transformation est le facteur de transformation de la surface : S' = S * det(A).

transformation-surface-2.png

Démonstration 1 :
on ramène le parallélogramme à une forme de surface identique en déplaçant le triangle supérieur en dessous du parallélogramme, de sorte que :
S' = base * hauteur = x0 * d
où il reste à déterminer x0 en exploitant la proportionnalité des deux triangles de bases b et a-x0 :
b / d = ( a − x0 ) / c    ⇔    x0 = a − b * c / d    ⇒
S' = ( a − b * c / d ) * d = a * d - b * c    ⇔ par n_determinant :
S' = det(A)
CQFD

On se rappellera déjà ici qu'à une surface correspond un produit vectoriel. On y reviendra plus loin.

Analyse de cas particuliers :

  • det(A) = 1 : une rotation, dont nous avons vu que le déterminant vaut 1 n_determinant-rotation, ne modifie pas la surface ;
  • det(A) = 0  ⇔  a * d - b * c = 0  ⇔  b / d = c / a
    ⇔ par avant dernier graphique : les pentes des deux côtés du parallélogramme sont égales    ⇒
    la surface initiale est transformée en un segment de droite ;
  • det(A) < 0 :  ⇔  a * d - b * c < 0  ⇔  b / d < c / a
    ⇔ par avant dernier graphique : la pente du vecteur (a,c) devient supérieure à celle du vecteur (b,d)    ⇔ la surface initiale est retournée (effet miroir ⇔ surface "négative").

    N.B. Si j'applique la règle de la main droite aux vecteurs unitaires je "dévisse", tandis que si je l'applique à leur transformation je "visse". On peut donc retenir la règle : image positive ⇔ dévisser ; image négative ⇔ visser.

transformation-surface-3.png
Revenons sur la démonstration de l'interprétation géométrique du déterminant. En voici une autre, plus formelle et qui nous permettra d'approfondir l'analyse :
soit la matrice   
ab
cd

ses deux colonnes représentent deux vecteurs transformés, qui par n_determinant-rotation sont tels que :

v =
a
c
  =  
v * cos α
v * sin α


w =
b
d
  =  
v * cos β
v * sin β


de sorte que :
det(A) = a * d - b * c = v * w * (sin α * cos β - cos α * sin β)    ⇔
det(A) = v * w * sin( β - α )
or la similitude du membre de droite avec le module du produit vectoriel montre que det(A) représente bien la surface du parallélogramme déterminé par v et w.
CQFD

Surface orientée. On peut maintenant interpréter la notion de surface négative comme une orientation déterminée par le signe de sin( β - α ) c-à-d par le signe de β - α (si cet angle est inférieur à 180°). Cette orientation est déterminée par la règle de la main droite : dans le graphique supra (β - α > 0) le produit scalaire est représenté par un troisième axe (z), qui sort du plan (dévissage) ; par contre si on avait β - α < 0 alors la position relative des vecteurs v et w serait inversée de sorte que l'axe z rentrerait dans le plan (vissage).

triangle-clipedia.png Vidéo Clipedia : Déterminant 3x3
3D

Ces considérations nous conduisent à étudier le cas des volumes c-à-d à des matrices de dimension 3. Nous allons voir qu'on retrouve l'équivalent des propriétés étudiées dans le cas des matrice de dimension 2. Mais avant de poursuivre introduisons une notation rationnelle du déterminant :

det(
uxvxwx
uyvywy
uzvzwz
) =
uxvxwx
uyvywy
uzvzwz

Soit le système matriciel suivant :

x'
y'
z'
=
uxvxwx
uyvywy
uzvzwz
*
x
y
z

vecteurs-3d.png

On y retrouve les propriétés analysées pour les matrices de dimension 2, notamment que les colonnes de la matrice de transformation sont les transformées des vecteurs unitaires.

NB : le graphique ci-joint attire l'attention sur le fait que la perspective 3D est écrasée : aucun des trois vecteur dessiné n'est nécessairement dans le plan X-Y correspondant à celui de votre écran. Cette remarque facilite la lecture du graphique suivant, qui illustre l'application de la règle de la main droite dans un espace 3D.

main-droite-3d.png

Dans ces conditions le produit vectoriel v x w est donné par n_produit-vectoriel-regle-calcul :
v x w = ( vy * wz - vz * wy ) * 1x - ( vx * wz - vz * wx ) * 1y + ( vx * wy - vy * wx ) * 1z

qui peut également s'écrire sous forme matricielle comme suit n_prod-scal-det :

v x w =  
1x vx wx
1y vy wy
1z vz wz

et dont la règle de calcul consiste à multiplier chaque vecteur de base par le déterminant 2×2 qui subsiste dans le tableau après avoir éliminé le reste de sa ligne et de sa colonne : .

calcul-determinant-3d.png

Le graphique suivant montre que les composantes (v...w...− v...w...) du produit scalaire sont respectivement les aires des projections – sur les plans yz, xz et xy – du parallélogramme construit sur les vecteurs v et w. La surface bleue du graphique (Syz) correspond au premier facteur du produit scalaire supra (vy * wz - vz * wy), au premier des trois déterminants ci-dessus. Enfin chacune des trois projections reproduit ce que l'on a analysé dans le cas des matrices de dimension 2.

v x w = Syz * 1x - Sxz * 1y + Sxy * 1z
projection-determinant-2-3d.png

Volume. De même que le déterminant d'une matrice de dimension 2 correspond à une surface, on se doute que le déterminant d'une matrice de dimension 3 correspond à un volume, lequel est calculé par un produit mixte (a→xb→)*c→ :

det(A) = u * ( v x w ) ≡ volume

determinant-3d.png

Démonstration :
par n_produit-scalaire-trigono
u * ( v x w ) = || u|| * || v x w|| * cosφ    ⇔
u * ( v x w ) = || u|| * S * cosφ = S * || u|| * cosφ    ⇔
u * ( v x w ) = S * h
CQFD
On retrouve donc une généralisation 3D de ce que l'on avait analyés en 2D : ici un cube d’arête 1 et de volume 1, dont les faces sont des carrés, est transformé en un parallélépipède non rectangle, dont les faces sont des parallélogrammes.

Analysons maintenant le déterminant. Pour ce faire exprimons ce volume en termes des composantes :

v x w = 1x * ( vy * wz - vz * wy ) - 1y * ( vx * wz - vz * wx ) + 1z * ( vx * wy - vy * wx ) *    ⇔
par forme algébrique du produit scalaire n_F*L=Fx*Lx+Fy*Ly :
u * ( v x w ) = ux * ( vy * wz - vz * wy ) - uy * ( vx * wz - vz * wx ) + uz * ( vx * wy - vy * wx )    ⇔
en reprenant la notation mnémonique :

u * ( v x w ) =
ux vx wx
uy vy wy
uz vz wz

où le membre de droite est noté det(A).

levogyre.png

Volume orienté.. Il ressort de :
u * ( v x w ) = || u|| * || v x w|| * cos(φ) n_matrice-volume
que det(A) > 0 si cos(φ) > 00 ≤ φ < π/2 ce qui dans le graphique supra correspond à un trièdre (v,w,u) dextrogire (le produit scalaire v x w va dans le sens de u). À l'opposé, dans le graphique ci-contre on a inversé v et w ⇒ le produit scalaire v x w ne va plus dans le sens de u (trièdre lévogyre), ce qui correspond à π/2 < φ ≤ π. Enfin det(A) = 0 si cos(φ) = 0φ = π/2, c-à-d que les trois vecteurs sont coplanaires ⇔ le volume est bien nul.

On notera enfin que :
u * ( v x w ) = ux * ( vy * wz - vz * wy ) - uy * ( vx * wz - vz * wx ) + uz * ( vx * wy - vy * wx )
est la somme de trois volumes :
u * ( v x w ) = ux * Syz - uy * Sxz + uz * Sxy

4D

Pour développer la notion de matrice de dimension n, on va commencer par étudier la matrice de dimension 4. Mais avant, il nous faire une parenthèse pour souligner le fait que la notion de déterminant ne fait sens qu'avec des matrices carrées. Pour ce faire rappelons-nous l'équivalence des égalités suivantes :

a * x + b * y = x'
c * x + d* y = y'


(a, b) . (x, y) = x'
(c, d) . (x, y) = y'


ab
cd
*
x
y
=
x'
y'


x
y
=
1 / det(A) *
d-b
-ca
*
x'
y'


x
y
= A-1 *
x'
y'

Or il est facile de vérifier que si A n'est pas carrée alors le système d'équation correspondant est soit sous-déterminé (# de variables > # d'équations) soit sur-déterminé (# de variables < # d'équations).

4D.png

Cette précision étant faite notons l'impossibilité de représenter un espace à 4 dimensions, raison pour laquelle dans le graphique ci-contre le 4° axe et le 4° vecteur sont représentés en hachuré.

Heureusement la notation mathématique n'est pas limitée par cette contrainte.

Ainsi le cas 3D, det(A) =

u * ( v x w )
=
ux *
vy wy
vz wz
- uy *
vx wx
vz wz
+ uz *
vx wx
vy wy

=
ux * Syz - uy * Sxz + uz * Sxy

devient

r * ( u x v x w )
=
rt *
ux vx wx
uy vy wy
uz vz wz
- rx *
ut vt wt
uy vy wy
uz vz wz
+ ry *
ut vt wt
ux vx wx
uz vz wz
- rz *
ut vt wt
ux vx wx
uy vy wy

=
rt * Vxyz - rx * Vtyz + ry * Vtxz - rz * Vtxy

Cette somme étant composée de 4 volumes de dimension 4, on entre ainsi dans le domaine des hypervolumes (dimension > 3), et en l'occurrence dans celui des parallélotopes.

Où l'on voit apparaître une structure de calcul en poupées russes (les "mineurs" du déterminant). Le nombre d'opération est ici de 63, de sorte que le calcule de déterminant est très lourd. Nous verrons des méthodes permettant de simplifier de nombreux cas de calcul.

nD

On peut maintenant généraliser au cas de matrices de dimension nxn. Notons que l'analogie est (évidemment) elle aussi limitée pour représenter des dimensions supérieures à trois : ainsi un matrice de niveau n contient n matrice de niveau n-1 (alors qu'une poupée russe n'en contient qu'une seule), de sorte que le nombre de poupées c-à-d de déterminants vaut N!, le dernier étant de dimension 1x1.

nD.png

det(A) = v1 * ( v2 x v3 x ... x vN )

Formule générale du déterminant
https://jortay.net/savoir-de-base#formule-generale-determinant
triangle-clipedia.png Vidéo Clipedia : Formule du déterminant

Le déterminant de la matrice 3x3 n_produit-mixte-3x3 est une somme de 6 produits de 3 facteurs :
ux * ( vy * wz - vz * wy ) - uy * ( vx * wz - vz * wx ) + uz * ( vx * wy - vy * wx )    =
ux * vy * wz - ux * vz * wy - uy * vx * wz + uy * vz * wx + uz * vx * wy - uz * vy * wx

det-3x3.png

3 colonnes u,v,w
3 lignes x,y,z

Cette somme de produits est telle que :

  • les facteurs des produits correspondent aux trois colonnes (u,v,w) du déterminant ;
  • les indices (x,y,z) des facteurs correspondent aux trois lignes, et ne se répètent jamais au sein de chaque facteur (puisque chaque mineur (*) est déterminé en éliminant la ligne et la colonne de son élément de référence) ;

(*) C-à-d les "poupées russes" évoquées supra, étant entendu qu'à la différence des poupées russes, un mineur de niveau n contient n mineurs de niveau n-1.

Il en résulte que le déterminant d'ordre n contient toutes les combinaisons possibles de n éléments distincts appartenant à des lignes et des colonnes différentes. Et il apparaît que les éléments de la somme supra sont donc les combinaisons que l'on peut obtenir de 3 lettres (x,y,z), leur nombre est donné par Anp = n ! / ( n - p ) !n_arrangements soit ici 3!/(3-2)=6.

determinant-damier.png

On voit également qu'il y a une forme de symétrie, inhérente au caractère carré de la matrice et au mode de calcul du déterminant. Il résulte de cette symétrie que le calcul du déterminant peut être réalisé à partir de n'importe quelle colonne ou ligne. La difficulté dans ce type de calcul est de ne pas se tromper dans l'attribution des signes moins (résultant de la règle de la main droite : pour cela il suffit de se rappeler que cette répartition est elle aussi symétrique, la règle étant celle du damier : dans l'image ci-contre les cases grisées correspondent aux signes négatifs, et l'on notera qu'elles correspondent également à une somme d'indices (ligne+colonne) impaire, ce qui est exprimé par (−1) i+j dans la la formulé générale du calcul de déterminant :

det(A) = ∑ iouj=1N (−1) i+j * aij * Mij

Mij est le mineur correspondant à l'élément aij, c-à-d déterminé par la suppression de la colonne et de la ligne de aij (il porte donc les indices de son référentiel) ;
iouj=1 signifie que le calcul peut être effectué sur n'importe quelle ligne i ou colonne j.

Que l'on simplifie encore par :

det(A) = ∑ iouj=1N aij * Cij
Cij = (−1) i+j * Mij est le "cofacteur" de l'élément aij.

Le déterminant d'une matrice est donc la somme des produits des éléments d'une rangée quelconque par leur cofacteur. En pratique, pour simplifier le calcul d'un déterminant, on le calculera sur base de sa ligne ou colonne contenant le plus de zéros.

Propriétés du déterminant
https://jortay.net/savoir-de-base#determinant-proprietes

On va étudier ici le cas de trois type de matrice : transposée, permutée et proportionnelle.

Matrice transposée. Soit la matrice A telle que :
[A]ij = aij
alors sa transposée est telle que :
[At]ij = aji
La transposée est donc une symétrie axiale autour de la première diagonale.

transposee.png

Dès lors qu'un déterminant peut être calculé selon n'importe quelle ligne ou colonne, il en résulte que det ( At )ij = det ( A )ij. Ces deux matrices correspondent à des parallélépipèdes de formes différentes (puisque les vecteurs sont différents) mais de volumes identiques (puisque les déterminants sont égaux)

transposee2.png

Matrice permutée. Une matrice est permutée si deux rangées parallèles (lignes ou colonnes) sont permutées. Géométriquement, la permutation de deux colonnes correspond à la permutation des vecteurs correspondants ⇒ la règle de la main droite montre que cette permutation change le signe du déterminant.

det(A) = u * ( v x w ) = V    ⇔ en permuttant v et w :
det(A') = u * ( w x v ) = -V    ⇔ en permuttant u et w :
det(A'') = w * ( u x v ) = V    ⇔ ...

Le développement ci-dessus concerne les permutations de colonnes, mais l'on observe le même phénomène avec les permutations de lignes :

soit :
B = At    ⇒
det(B) = det(A) = V
soit :
B' = A't    ⇒
det(B') = det(A') = -V
etc.

de sorte qu'après n permutations de rangées parallèles le déterminant est multiplié par (−1)*n : det ( A (n) ) = (-1) n * det ( A )

Matrice proportionnelle. Une matrice est dite proportionnelle si elle a au moins deux rangées (lignes ou colonnes) proportionnelles. Étudions le cas du calcul du déterminant d'une matrice proportionnelle relativement à une rangée non proportionnelle. Or on vérifie facilement que, étant donné le mode de calcul des déterminants, les mineurs impliquant les deux rangées proportionnelles sont nécessairement nuls, et donc le déterminant de la matrice aussi. Et ce principe vaut pour toute matrice de degré n : la nullité des mineurs de dernier niveau se répercutant dans tous les niveaux de la "poupée russe" du calcul du déterminant. Le graphique suivant illustre l'interprétation géométrique : le "plan" déterminé par les deux vecteurs proportionnels w=α*v est ramené à une droite, et donc le volume à un plan ⇒ le volume est nul, et le volume c'est le déterminant. On a donc que :

le déterminant d'une matrice proportionnelle est nul

matrice-proportionnelle.png
Linéarité

Cette quatrième propriété est la plus importante car elle permet de simplifier le calcul matriciel (c-à-d du calcul de déterminants). Par "linéarité" on entend ici que si tous les éléments d’une seule rangée (ligne ou colonne) d’un déterminant sont multipliés par une constante, alors la valeur de ce déterminant (et donc le volume) est aussi multipliée par cette constante :

Soit la matrice A telle que :
det(A) = u * ( v x w ) = V
alors
det(A') = α * u * ( v x w ) = α * V

Cette démonstration concerne les colonnes. Pour faire la démonstration concernant les lignes on peut utiliser :
det(A) = ∑ iouj=1N aij * Cij n_formule-generale-det, appliquée par exemple à la première ligne :
det(A) = ∑ j=1N a1j * C1j    ⇒
det(A') = ∑ j=1N α * a1j * C1j = α * ∑ j=1N a1j * C1j = α * det(A)
CQFD

Somme de déterminants. Il découle de la propriété de linéarité que det(A+B) ≠ det(A) + det(B). démonstration :
Soit les matrices :
A telle que : det(A) = u * ( v x w ) = V
A' = α * A
alors
det(A') = α * u * [ ( α * v ) x ( α * w ) ] = α 3 * u * ( v x w ) = α 3 * det(A)    ⇒
det(α * A) = α N * det(A) ≠ α * det(A)
NB : on voit ici qu'il n'y a plus linéarité dès que plus d'une rangée est multipliée par une constante.
⇒ soit α=2 :
det(A+A) ≠ det(A) + det(A)    ⇒
det(A+B) ≠ det(A) + det(B)

somme-volumes.png

Méthode de calcul. Revenons maintenant au cas :
det(A') = 2 * u * ( v x w ) = 2 * V    ⇔
det(A') = ( u + u ) * ( v x w ) = 2 * V    ⇔
det(A') = u * ( v x w ) + u * ( v x w ) = V + V

det(A') = ( u + s ) * ( v x w ) = Vu + Vs    ⇔
det(A') = u * ( v x w ) + s * ( v x w ) = Vu + Vs

Ainsi le volume du parallélépipède déterminé par les lignes hachurée en rouge est égal à Vu + Vsdet( A' ) = det( Au ) + det( As ), que l'on démontre trivialement à partir de det(A) = ∑ iouj=1N aij * Cij n_formule-generale-det :
i=1N ( ai1 + a'i1 ) * Ci1 = ∑ i=1N ai1 * Ci1 + ∑ i=1N a'i1 * Ci1

technique-calcul-det.png

Pour élaborer notre technique de simplification du calcul de déterminant, on va poser s = v. Or dans ce cas det(As)=0 par n_det-matrice-propor. Ainsi si l'on remplace la première colonne par la somme de celle-ci avec la seconde, on conserve le même déterminant.

Et si l'on pose plutôt s = α * v + β * w on obtient toujours le même résultat induit pas n_det-matrice-propor : le déterminant reste inchangé ! Et c'est grâce à cela que l'on va pouvoir simplifier des déterminants. L'idée est de chercher des combinaisons linéaires qui permettent de simplifier le déterminant que l'on souhaite calculer, c-à-d d'obtenir des zéros dans la rangée modifiée (ligne ou colonne).

Ainsi dans l'exemple suivant on a pu transformer la matrice en une matrice triangulaire, dont le déterminant vaut tout simplement le produit des éléments de la diagonale !

matrice-diagonale.png
Matrice inverse
https://jortay.net/savoir-de-base#matrice-inverse
triangle-clipedia.png Vidéo Clipedia : Inversion matricielle
Illustration

La résolution de nombreux calculs d'ingénierie requiert l'utilisation de l'inverse d'une matrice. C'est par exemple le cas de l'évaluation (par simulation informatique) des effets des forces aérodynamiques sur la structure d'un avion (évaluation de sa déformabilité).

Ainsi dans le modèle matriciel A * X = F :
• la matrice F décrit les forces aérodynamiques ;
• la matrice A décrit la structure matérielle de d'avion ;
• la matrice X décrit les déformations imprimées à la structure de l'avion (A) par les forces aérodynamiques (F).

L'égalité exprime la troisième loi de Newton (ou principe d'action-réaction) n_troisieme-loi-newton ⇒ pour connaître l'ampleur des déformations de la structure (c-à-d X) il faut exprimer X en fonction des valeurs connues que sont les forces aérodynamique (F) et la résistance du matériau constituant la structure de l'avion (A) ⇔ X = A-1 * F

Pratiquement la modélisation de l'avion se fait sous forme de points appelés "noeuds" (de sorte que ce type de modélisation est appelé "procédure de discrétisation"). Il s'agit alors d'évaluer la déformabilité (X) du modèle d'avion à partir des valeurs connues que sont la déformabilité du matériaux constituant la structure (A) et les forces aérodynamiques (F).

Calcul

Trouver la matrice A-1 c'est trouver la matrice A-1 telle que A-1 * A = I. Pour ce faire on va nommer les constituants de A-1 de telle sorte que ses trois lignes représentent trois vecteurs, associés au vecteurs de A, par transposition et notation majuscule (nous verrons plus loin pourquoi).

calcul-matrice-inverse.png

Or nous avons vu que le produit matriciel se calcule comme suit : l'élément i j de la matrice produit C=A*B est égal au produit scalaire de la ligne i de A par la colonne j de B n_produit-matriciel. Et l'on voit dans l'égalité ci-dessus que :

  • U doit être perpendiculaire à v et w car : U * v = U * w = 0 n_produit-scalaire-angle-droit
  • V doit être perpendiculaire à u et w car : V * u = V * w = 0
  • W doit être perpendiculaire à u et v car : W * u = W * v = 0

Or pour obtenir ces doubles perpendicularités il suffit de poser que :

  • U est produit vectoriel de v et w : U = v x w n_prod-vect
  • V est produit vectoriel de w et u : V = w x u
  • W est produit vectoriel de u et v : W = u x v

D'où il résulte que, concernant les éléments de la diagonale de la matrice du membre de droite :

  • U * u = ( v x w ) * u = det(A)
  • V * v = ( w x u ) * v = det(A)
  • W * w = ( u x v ) * w = det(A)

En effet nous avons vu que le déterminant correspond au volume déterminé par ses vecteurs, et qu'on le calcule par le produit mixte de ceux-ci n_matrice-volume. Ce produit mixte peut évidemment être calculé dans tous ses ordres.

Or l'on devrait avoir U * u = V * v = W * w = 1. Par conséquent la matrice faite des vecteurs lignes n'est pas A-1 mais det(A)*A-1 (et après mise en évidence de det(A) dans le membre de droite, puis élimination dans les deux membres on retrouve bien A-1 * A = I).

calcul-matrice-inverse-2.png

Il reste donc à calculer les éléments de la matrice det(A)*A-1. Pour ce faire on va utiliser le fait que ces trois vecteurs lignes ont été définis supra comme étant trois produits vectoriels. Ainsi pour la première ligne on a par n_prod-scal-det :

U = v x w =  
1x vx wx
1y vy wy
1z vz wz

dont la composante en x, c-à-d l'élément Ux de la matrice det(A)*A-1, est par n_produit-vectoriel-regle-calcul le cofacteur de 1x :

Ux =
vywy
vzwz

que l'on retrouve dans la matrice A comme cofacteur de ux.

On peut alors généraliser par la constatation suivante : les composantes de chaque vecteur ligne de la matrice det(A)*A-1 (majuscules) sont les cofacteurs des éléments de la colonne correspondant de A (minuscules).

NB : ne pas oublier les signes "-" du damier dans le calcul des cofacteurs : n_formule-generale-det. Ainsi :
Uy = -
vxwx
vzwz

On va alors construire la matrice des cofacteurs de la matrice A, notée CA, et qui est la matrice A dont les éléments minuscules sont remplacés par les éléments majuscules de det(A)*A-1, ou encore la transposée de det(A)*A-1 : det(A) * A-1 = CAt

A-1 = CAt / det(A)

dont on constate que c'est un généralisation de n_matrice-inverse.

matrice-cofacteurs.png

Notons enfin que si le produit matriciel n'est généralement pas commutatif n_produit-mat-non-comm, il l'est cependant dans le cas du produit d'une matrice par son inverse :
A-1 * A = I   ⇔
A * A-1 * A = A * I = A   ⇔
A * A-1 = I
CQFD

Déterminant d'un produit de matrices
https://jortay.net/savoir-de-base#determinant-produit

Soient les matrices A et B ⇒ :
det(A) = ∑ iouj=1N aij * CijA
det(B) = ∑ iouj=1N bij * CijB

det(A*B) = ∑ iouj=1N ( ∑ k=1N  aik * bkj ) * CijAB = det(A) * det(B)

La démonstration de l'égalité entre le membre de gauche et celui de droite par développement du membre central est trop complexe algébriquement. C'est pourquoi on va se limiter ici à une interprétation géométrique (à deux dimensions, mais que l'on peut facilement généraliser). Cette interprétation sera l'occasion de résumer l'essentiel de la matière que nous venons de développer au sujet du calcul matriciel.

Une matrice de dimension 2 (c-à-d 2x2) peut être vue comme représentant la transformation d'une surface dans le plan de coordonnées cartésiennes.

matrice-synthese.png

Cette transformation est telle que :

  • les vecteurs unitaires 1x de coordonnées (1,0) et 1y de coordonnées (0,1), qui représentent un carré, sont transformés en deux vecteurs u de coordonnées (a,c) et v de coordonnées (b,d), qui représentent un parallélogramme ;
  • les cordonnées de ces deux vecteurs constituent les deux colonnes de la matrice ;
  • le déterminant représente la surface de l'aire transformée, et par conséquent le facteur par lequel l’aire du carré unitaire est multipliée pour donner l’aire du parallélogramme.
Ainsi dans le système matriciel :

ab
cd
*
x
y
=
x'
y'


il suffit de remplacer (x,y) par (1,0) pour obtenir que a*1+b*0=a et c*1+d*0=c :

ab
cd
*
1
0
=
a
c


et de remplacer (x,y) par (0,1) pour obtenir que a*0+b*1=b et c*0+d*1=d :

ab
cd
*
0
1
=
b
d


ou encore de remplacer (x,y) par (1,1) pour obtenir que a*1+b*1=a+b et c*1+d*1=c+d :

ab
cd
*
1
1
=
a+b
c+d
=
a
c
+
b
d

Où l'on voit que le vecteur position déterminé par le point (1,1) a été transformée en le vecteur somme u + v.

de la même manière on peut remplacer (1,1) par (x,y) pour obtenir a*x+b*y et c*x+d*y :

ab
cd
*
x
y
=
a*x+b*y
c*x+d*y
=
a*x
c*x
+
b*y
d*y
= x *
a
c
+ y *
b
d

On peut donc généraliser en disant qu'un rectangle de surface x*y et d'origine (0,0) est transformée en un parallélogramme de surface x * y * det(A) et situé à la même origine.

Et l'on peut étendre cette généralisation à toute surface ε2 dont l'origine est (x,y), et qui est donc transformée en une surface ε2 * det(A) d'origine ( a * x + b * y , c * x + d * y ).

Et l'on peut encore étendre la généralisation à toute aire composée de petits carrés de surface ε2.

matrice-synthese-2.png

Comme en outre on peut abaisser la valeur de ε à un niveau arbitraire, on peut donc dessiner n'importe quel surface, y compris avec des contours "arrondis". Enfin la généralisation peut s'étendre à des volumes de dimension N.

Et comme le produit matriciel B*A correspond à l'application de la transformation par B à la transformation par A n_transformations-multiples :
S=1 ⇒ SA = 1 * det(A) ⇒ SBA = det(A) * det(B)
det(B*A) = SBA = det(B) * det(A)
CQFI.

En particulier si B=A-1
det(A-1*A) = SA-1A = det(A-1) * det(A)    ⇔
det(I) = det(A-1) * det(A)    ⇔
det(A-1) = 1 / det(A) = det(A)-1

Et si B=A
det(A*A) = SAA = det(A) * det(A)    ⇔
det(A2) = det(A) * det(A)    ⇔
det(A2) = det(A)2

Dynamique

https://jortay.net/savoir-de-base#dynamique

Alors que la géométrie mesure surfaces et volumes, la dynamique mesure les mouvements dans l'espace, et décrit leurs causes.

 5.1. Cinématique : MRU et MRUA
 5.2. Force et mouvement
 5.3. Force et pression
 5.4. Force et énergie
 5.5. Rotation

Cinématique : MRU et MRUA

https://jortay.net/savoir-de-base#cinematique

Mouvement rectiligne uniforme (MRU) :

La vitesse v est la distance xt - x0 parcourue durant le temps t :

v = ( xt - x0 ) / t     ⇔
xt = x0 + v * t    ⇔
xt - x0 = v * t    ⇒
xt - x0 est la surface en dessous de la droite vt = v0

MRU.png

NB : lorsque l'on dit que la distance parcourue est égale à la "surface" du rectangle vert on veut dire en fait que la distance parcourue (en m et non en m2 bien évidemment) est égale au produit de sa hauteur (en m/s) et de sa longueur (en sec.) de sorte que son unité est bien m/s*s=m.

Mouvement rectiligne uniforme accéléré (MRUA) :

L'accélération a est la vitesse vt - v0 acquise durant le temps t :

a = ( vt - v0 ) / t   ⇔   vt = v0 + a * t    ⇒
(NB : équation du 1° degré en t)
si on reprend l'interprétation géométrique constatée pour n_vitesse c-à-d que xt - x0 est la surface en dessous de la fonction vt (cf. graphique ci-dessous)    ⇒
xt - x0 = v0 * t + [ ( v0 + a * t - v0 ) * t ] / 2    ⇔
(où [ ( v0 + a * t - v0 ) * t ] / 2 est la moitié du rectangle au-dessus du rectangle vert )
xt - x0 = v0 * t + a * t2 / 2    ⇔
xt = x0 + v0 * t + a * t2 / 2    ⇔
(NB : équation du 2° degré en t)
xt = x0 + ( v0 + vt ) / 2 * t
(NB : équation du 1° degré en t)

MRUA.png
  • NB : on retrouve le MRU en posant a=0.
  • Nous verrons la démonstration mathématique du MRUA dans la section consacrée au calcul intégral.
  • L'analyse ci-dessus (cinématique) fait abstraction des masses qui caractérisent les corps, ainsi que les éventuelles forces qu'ils peuvent subir ou exercer en relation avec d'autres corps (cinétique).

Force et mouvement

https://jortay.net/savoir-de-base#force-mouvement
triangle-clipedia.png Vidéo Clipedia : Principe de relativité

Le principe de relativité postule l'équivalence entre MRU et repos : ils constituent tous les deux un référentiel inertiel c-à-d tel que la vitesse est constante en direction et en norme.

Accélération vs décélération sont relatifs comme le sont MRU vs repos.

triangle-clipedia.png Vidéos Clipedia : Principe d'inertie // Galilée

Le principe d'inertie est très proche du principe de relativité : il postule qu'il n'est pas besoin de subir une force pour être en mouvement.

triangle-clipedia.png Vidéo Clipedia : Loi de Newton

Un corps ne doit pas nécessairement subir une force pour être en mouvement (principe d'inertie), mais par contre la modification d'un mouvement ou du repos implique l'action d'une force. La loi de Newton exprime comment mesurer cette force. Exercer une force F c'est imprimer une accélération a au déplacement d'une masse m :
F = m * a [kg * m / s2 = N]

L'accélération exprime la progressivité dans la modification d'un mouvement.

La loi d'action-réaction, ou "troisième loi de Newton" énonce que toutes les forces apparaissent par couple de forces opposées :

  • soit l'accélération de pesanteur terrestre gT ≈ 9,8 mT/s2 ⇒ pour tenir/soulever dans ma main une masse de 1kg je dois exercer une force de 9,8 N, qui est le poids de cette masse c-à-d sa force d'inertie ;
  • le passager en apesanteur dans un véhicule spatial qui démarre (MRUA) donne l'impression d'être projeté contre la paroi arrière du véhicule, mais c'est en réalité celle-ci qui s'avance vers lui, jusqu'au moment où il est rattrapé, ce qui marque son passage d'un référentiel inertiel à celui que constitue le véhicule; à partir de ce moment le passager subit deux forces : la force motrice qui propulse le véhicule en avant, et la force d'inertie, opposée, qui le maintient contre la paroi jusqu'à ce que la vitesse devienne constante (MRU) moment à partir duquel il retourne en apesanteur (mais cette fois dans un référentiel qui n'est plus inertiel).

Force et pression

https://jortay.net/savoir-de-base#force-pression

Pression = Force / Surface

Les vidéos de cette section sont essentiellement des applications des sections précédentes. Au niveau théorique le seul ajout notable est celui de la pression.

Force et énergie

https://jortay.net/savoir-de-base#force-energie
triangle-clipedia.png Vidéos Clipedia : Energie : introduction // Le travail

Réaliser un travail W c'est exercer, durant un temps t, une force F sur une distance x :
W = F * x(t)
[W] = N * m = J

Dans n_travail x(t) est parfois notée plus simplement L (pour longueur).

triangle-clipedia.png Vidéos Clipedia : Les leviers // Les poulies // Le moment de force

Leviers. Le principe du levier – qui permet de démultiplier une force – est une application fondamentale de la notion de travail.

Le levier est un système mécanique caractérisé par trois points (cf. graphique infra) :

  • point d'appui (du levier) ;
  • point d'application de la force motrice FM sur le levier ;
  • point d'application de la force résistante FR (là où se situe la masse).
levier-inter-appui.png

Aux points d'application de FM et de FR correspondent les distances LM et LR, toutes deux mesurées par rapport au point d'appui.

On distingue divers types de levier :

  • inter-appui : le point central est le point d'appui (graphique ci-dessus)  ;
  • inter-résistant : le point central est le point de résistance (cas de la brouette) ;

La loi des leviers :
FM * LM = FR * LR
s'écrit plus simplement en l'exprimant comme l'égalité des moments de force n_τ=r*F*sin(θ) :
τM = - τR

Démonstration à partir du principe de conservation de l'énergie : il y a égalité entre d'une part le travail associé au déplacement dM du point d'application de la force motrice FM, et d'autre part le travail associé au déplacement correspondant dR du point d'application de la force résistante FR :
W = FM * dM = FR * dR
D'autre part on peut établir géométriquement la valeur du ratio de multiplication (r) en constatant la constance du rapport :
dM / LM = dR / LR
(cf. les deux triangles axés sur le point d'appui du levier)    ⇔
dM / dR = LM / LR = r
qu'il suffit alors de substituer dans l'égalité WM = WR pour obtenir n_loi-leviers
CQFD.

Énergie cinétique. Dans W = F * x(t) n_travail on substitue F = M * a n_F=m*a     ⇒
W = M * a * x(t)
où l'on substitue
a = v(t) / t n_a=v(t)/t
x(t) = v(t) * t / 2 n_xt=x0+(v0+vt)/2*t

W = M * v(t) / t * v(t) * t / 2     ⇔
W = M * v(t)2 / 2

Lorsque le travail s'arrête l'énergie dans laquelle il s'est transformé (principe de conservation) a atteint un niveau maximum ⇒ la vitesse devient constante : on est donc revenu au MRU, celui des planètes qui dans le vide ne sont pas soumises à des forces de frottement :

Ec = M * v2 / 2

Rotation

https://jortay.net/savoir-de-base#rotation
rotation-composantes.png

Dynamique
de rotation

Pour illustrer le mouvement de rotation on prend le cas du pendule, mais en faisant abstraction de la force de gravitation : on peut donc le considérer dans un plan horizontal. Et étant donné la construction du système de pendule, la force centrifuge exercée par la masse sur la tige du pendule est compensée par la force centripète (en raison de la rigidité du câble). Le même principe vaut pour la composante de la force dans le sens du pendule. Il ne reste donc que la composante de force perpendiculaire à la tige du pendule ⇒ on peut décrire ce mouvement circulaire comme s'il était rectiligne ⇒ on peut appliquer la loi de Newton :

rotation-calcul.png

Étape 1.
m * a = F    ⇔   par n_sinus :
m * a = F * sin(α)    ⇔
m * d2x / dt2 = F * sin(α)
Pour modéliser le mouvement de rotation on ne va pas utiliser la coordonnée de position x mais la coordonnée angulaire θ. Pour ce faire on passe de x à θ (en radians) par :
x = r * θ n_radian    ⇒
d2x / dt2 = r * d2θ / dt2   ⇒
m * r * d2θ / dt2 = F * sin(α)    ⇔
d2θ / dt2 = F * sin(α) / ( m * r )    ⇒
dθ / dt = F * sin(α) / ( m * r ) * t   ⇒
θ = F * sin(α) / ( m * r ) * t 2 / 2   ⇔
c-à-d l'équivalent angulaire de xt = x0 + v0 * t + a * t2 / 2 n_xt=x0+v0*t où la position et vitesse initiales sont nulles.

NB : l'accélération angulaire dθ / dt = F * sin(α) / ( m * r ) est donc au mouvement de rotation ce que l'accélération rectiligne a est au MRUA.

Étape 2. Passons maintenant à un cas plus général, tel que le point d'application de la force extérieure n'est pas nécessairement situé sur la masse (cf. graphique suivant).

rotation-levier.png

En fait il s'agit d'un système de levier, et on peut donc lui appliquer la loi des leviers n_loi-leviers :
r * fi = rF * F * sin(α)    ⇔
fi = rF / r * F * sin(α)    ⇒
en vertu de la notion d'équilibre dynamique, c-à-d le fait que les forces apparaissent toujours par couple de forces opposées n_troisieme-loi-newton :
f = rF / r * F * sin(α)

On refait alors comme précédemment :
m * a = f    ⇔
m * d2x / dt2 = rF / r * F * sin(α)    ⇔
m * r * d2θ / dt2 = rF / r * F * sin(α)    ⇔
NB : on retrouve bien le cas précédent (force appliquée sur la masse) en posant rF = r.
d2θ / dt2 = rF * F * sin(α) / ( m * r2 )    ⇔
θ(t) = 1/2 * rF * F * sin(α) / ( m * r2 ) * t2

⇔ par τ = rF * F * sin(α) n_τ=r*F*sin(θ) :
d2θ / dt2 = τ / ( m * r2 )    ⇔
θ(t) = 1/2 * τ / ( m * r2 ) * t2

Le carré du rayon exprime une forte sensibilité à la distance.

Si on passe de la notation scalaire à la notation vectorielle pour appliquer la règle de la main droite, on observe que ses résultats (symboles ⊗ et ⊙ au point pivot) sont cohérents avec l'égalité des moments de force (au signe près) :
τi = r x fi = r x - f = - τf    ⇒
par supra :
r * f = rF * F * sin(α)    ⇒
- τi = τ    ⇔
τi + τ = 0

Étape 3. Passons maintenant à un cas encore plus général en supposant le cas de deux masses distinctes du point d'application de la force extérieure.

rotation-levier-2.png

Pour ce faire on va à nouveau recourir à la notion d'équilibre dynamique exprimée en fonction des moments de force :
τi1 + τi2 + τ = 0
c-à-d que le moment de force extérieur compense les moment de force d'inertie combinés. Et selon ce même principe d'équilibre dynamique les forces d'inertie sont compensées par les forces qui accélèrent les masses, via la structure rigide du pendule c-à-d via leurs moments de force respectifs :
τi1 = - τ1 et τi2 = - τ2
que l'on substitue dans l'égalité précédente    ⇒
τ1 + τ2 = τ
⇒ on passe à la notation scalaire, ce qui simplifiera le développement :
τ1 + τ2 = τ
où l'on injecte les valeurs de τ données par le résultat de l'étape 2    ⇒
m1 * r12 d2θ / dt2 + m2 * r22 d2θ / dt2 = τ    ⇔
( m1 * r12 + m2 * r22 ) * d2θ / dt2 = τ
• où J = m1 * r12 + m2 * r22 est le "moment d'inertie"
• où l'on retrouve le résultat de l'étape 2 en posant r1=r2 et m1+m2=m

Le tableau suivant permet de comparer la loi de Newton et sa version adaptée au mouvement circulaire.

Rectilignem * d2x / dt2 = f
Rotation( m1 * r12 + m2 * r22 ) * d2θ / dt2 = τ
rotation-volumes-2.png

Généralisation finale :

  • l'équation du mouvement de rotation vaut pour un nombre indéfini de masses, dont le moment d'inertie vaut : J = ∑n=1N mn * rn2
  • l'équation du mouvement de rotation vaut également pour une localisation indéfinie dans l'espace à trois dimensions (du système du levier) car toute localisation en dehors de l'axe contenant le point d'application de la force extérieure peut y être ramené par rotation et translation ; NB : la distance r se calcule par rapport à la distance à l'axe de rotation.

En pratique pour calculer le moment d'inertie d'un corps en trois dimension on va "décomposer" celui-ci en un nombre arbitrairement élevé de cubes élémentaires ΔVn (donc de taille arbitrairement petite), chacun étant caractérisé par une distance rn par rapport à l'axe de rotation. Quant à la masse de chacun de ces volumes élémentaires on l'obtient par la masse volumique ρ : mn = ρ * ΔVn n_masse-volumique
J = ∑n=1N ρ * ΔVn * rn2   ⇒
J = ∫n=1N ρ * dVn* rn2

On peut montrer que l'on obtient des formules assez simples pour le moment d'inertie des volumes suivants :

rotation-volumes.png
Énergie
de rotation

À ce corps en mouvement de rotation, auquel sont associés une masse et une vitesse, correspond par conséquent une énergie cinétique Ec = m * v2 / 2 n_energie-cinetique. D'autre part, étant donné que l'arc-radian x = r * θ n_radianv = dx / dt = r * dθ / dt.

On appelle vitesse angulaire w = dθ / dt = 2 * π / T
T est la période du mouvement c-à-d le temps mis pour faire un tour,
v = r * ω
que l'on substitue dans n_energie-cinetique
Ec = m * r2 * ω2 / 2    ⇔ par n_moment-inertie-1 :
Ec = J * ω2 / 2    ⇔

Le tableau suivant compare les formules de l'énergie cinétique selon le type de mouvement.

RectiligneEc = m * v2 / 2
RotationEc = J * ω2 / 2
moment-anneau.png

Application. On prend le cas d'un moteur monocylindre, dont le mouvement du cylindre est en quatre temps : explosion (qui produit de l'énergie) plus trois phases (échappement ⇒ admission ⇒ compression), qui ne produisent pas d'énergie ⇒ pour que le moteur fonctionne à une vitesse constante on va chercher de l'énergie additionnelle dans l'énergie cinétique accumulée dans un volant adossé au moteur. Pour calculer son énergie cinétique on utilise la formule du moment d'un anneau (graphique ci-contre), obtenue par le calcul d'intégration de volumes ébauché supra :
J = 1/2 * M * ( R12 + R22 )    ⇒
en injectant les valeurs du schéma ci-contre (la valeur de ρ est celle de l'acier) on trouve :
J ≈ 1,9 kg*m2
On suppose que le moteur tourne à une fréquence de :
f = 2.400 tour/min = 40 tr/s (= Hz)
or la fréquence est par définition l'inverse de la période T    ⇒
ω = 2 * π / T ≈ 251 Hz   n_vitesse-angulaire    ⇒
Ec = J * ω2 / 2 ≈ 1,9 * 2512 / 2 ≈ 60.000 J
ce qui représente l'énergie nécessaire pour envoyer une masse de 1kg à une hauteur de 6.000 mètres :

  • Ec = W = F * L n_travail    ⇒
    L = W / F = 60.000 / F
  • F = m * a n_F=m*a    ⇒ F ≈ 1 * 10 = 10 N

⇒ L = 60.000 / 10 = 6.000 m

Le tableau suivant compare les formules de (moment) de force, énergie et vitesse selon le type de mouvement.

(Moment de) ForceÉnergieVitesse
Rectilignem * d2x / dt2 = fEc = m * v2 / 2v = dx /dt
Rotation( n=1N mn * rn2 ) * d2θ / dt2 = τ Ec = J * ω2 / 2ω = dθ / dt

Ainsi dans le MRUA la force d'inertie exercée sur le corps est déterminée par la masse m tandis que dans le mouvement de rotation elle est déterminée par le moment d'inertie J = ∫n=1N ρ * dVn * rn2.

Matière

https://jortay.net/savoir-de-base#matiere

Le développement des techniques de calcul (algèbre) a favorisé le développement technologique, qui a lui-même facilité l'étude des particules élémentaires de la matière.

 6.1. Gaz parfaits
 6.2. Atomes
 6.3. Réaction chimique, mole
 6.4. Masse et débit volumiques
 6.5. Particules et électricité

Gaz parfaits

https://jortay.net/savoir-de-base#gaz-parfait

La loi des gaz parfaits constitue la base de la thermodynamique. Au 19° siècle on avait découvert expérimentalement la loi des gaz parfaits :
P * V = N * kB * T
: à température constante si l'on diminue le volume alors la pression augmente. Afin de comprendre les mécanismes physiques de cette loi il faut prendre en compte la nature atomique (c-à-d non continue) de la matière.

piston.png

Étape 1

On étudie d'abord le cas simplifié d'un volume de gaz contenu dans un piston librement coulissant, et composé d'une seule particule en mouvement vertical d'allers-retours, et dont on connaît la masse et la vitesse. On veut alors identifier les conditions d'équilibre volumique de ce gaz, c-à-d telles que la force d'impact moyenne f̄ de cette particule contre le piston est égale au poids M * g de celui-ci. f̄ est donc une force imaginaire continue qui porte le piston comme si celui-ci reposait sur un socle (portage statique ≈ portage dynamique) :
f̄ = M * g (troisième loi de Newton ou principe "d'action-réaction" : toutes les forces apparaissent par couple de forces opposées).
Vu que g est connu il reste à déterminer M.
Pour ce faire on recourt au principe selon lequel l'équilibre est caractérisé par la conservation des quantités de mouvement du piston (M*V) et du volume de gaz (m*v) :
M * V = m * v
M = m * v / V   ⇒ il reste à déterminer V.
Or, soit x la position verticale du piston, on peut considérer que l'équilibre est caractérisé par xt=0 dans
x = ( V * T ) - g / 2 * T2 n_xt=x0+v0*t V est la vitesse initiale du piston et T le temps mis par la particule pour faire un aller-retour     ⇔
V = g * T / 2  ⇒ il reste à déterminer T.
Or soit L la hauteur du volume de gaz :
v = 2 * L / T  ⇔  T = 2 * L / v   ⇒   substit. dans V :
V = g * L / v  ⇒  substit. dans M :
M = m * v2 / g / L  ⇔  M * g = m * v2 / L     ⇔
f̄ = m * v2 / L
f̄ est ainsi déterminé puisque l'on connaît m, v et L. En outre on s'est affranchi de g dans son expression. On est alors en mesure de faire le lien avec la loi expérimentale grâce à Ec = m * v2 / 2 n_energie-cinetique que l'on substitue dans n_f=m*v2/L    ⇒
f̄ * L = 2 * Ec     ⇒
Soit S la surface supérieure du cylindre :
( f̄ / S ) * ( L * S ) = 2 * Ec     ⇔
P * V = 2 * Ec qu'en comparant avec
P * V = N * kB * T on pourrait qualifier de "loi des gaz parfaits à une particule". Il nous reste donc à généraliser au cas de N particules.

Étape 2

On va maintenant étendre l'analyse au cas de N particules de vitesse d'angles quelconques. Nous raisonnons alors dans le cadre d'un gaz à l'équilibre tel que la force d'impact moyenne f̄ de ses particules contre chacune de ses parois est égale à la force de réaction exercée par celles-ci.

Pour ce faire on va considérer que le gaz est parfait c-à-d que ses particules n'interagissent pas, ce qui requiert :

  • de les considérer comme de simples "masses ponctuelles" c-à-d de volume nul, de sorte que leur taille étant sans commune mesure avec la distance caractéristique qui les sépare elles ne se rencontrent jamais (il n'y a donc pas d'interactions entre elles) ; on dit alors que le gaz qu'elles forment est "dilué" c-à-d que sa pression est faible ;
  • que sa température ne soit pas trop basse, sans quoi il y aura des agrégats de particules c-à-d des interactions entre elles (et il ne s'agit alors plus d'un gaz parfait).

La particule étant ponctuelle on peut considérer sa vitesse non plus comme un scalaire mais comme un vecteur, ce qui permet de considérer des vitesses d'angles quelconques.
ft = m * dv/dt    ⇔
ft = m * (dvx/dt * 1x + dvy/dt * 1y + dvz/dt * 1z)    ⇒
Mais comme d'autre part on suppose l'absence de frottement avec les parois ainsi que dans le volume, il n'y a que la composante en x de la vitesse (vx) qui change (lors du contact avec la paroi) :
ft = m * dvx/dt * 1x   ⇔
ft, force d'impact moyenne d'une particule d'inclinaison quelconque, est orientée perpendiculairement à la paroi qui subit le choc.

Dans l'étape théorique suivante les forces d'impact exercées par les N particules sur la paroi sont sommées en une force unique :
F = ∑ f̄n ⇒ par n_f=m*v2/L :
F = ∑ m * v2nx / L    ⇔
F = N * m / L * ∑ vnx2 / N    ⇔
F = N * m / L * < vx2 >
où < vx2 > est la moyenne "d'ensemble" (tandis que f̄ est une moyenne "temporelle") des vitesses en x.

Ensuite en raison de la distribution isotrope des vitesses (aucune des directions donc aucune des composantes de la vitesse n'est privilégiée puisqu'on se situe dans le vide) on a que le module
< v2 > = 3 * < vx2 >     ⇒
F = N * m / L * < v2 > / 3     ⇔ (en divisant par la surface S de la paroi supérieure)
P = N * m / V * < v2 > / 3     ⇔
P V = N * m * < v2 > / 3     ⇒
si l'on compare avec l'égalité expérimentale
P * V = N * kB * T
on en déduit que
m * < v2 > / 3 = kB * T    ⇒
2 * < m *v2 / 2 > / 3 = kB * T
Or Ec = m * v2 / 2 n_energie-cinetique    ⇒
T = 2/3 * < Ec > / kB
où < Ec > est l'énergie cinétique moyenne par particule de gaz.

On comprend alors physiquement ce qu'est la température. On comprend en particulier pourquoi la température la plus basse qui puisse exister – le zéro absolu – est celle d'un gaz parfait dont l'énergie cinétique est nulle, niveau le plus bas que l'énergie cinétique puisse atteindre. On comprend également qu'en apportant de la chaleur à un gaz on augmente son énergie cinétique.

Atomes

https://jortay.net/savoir-de-base#atomes
triangle-clipedia.png Vidéo Clipedia : Atomes
Principes

Un atome est une particule élémentaire de matière. On a recensé à ce jour 116 types d'atomes ("éléments"). Ils sont classés dans le tableau des éléments (cf. infra). On les représente physiquement sous forme d'une sphère (modèle atomique).

Nous verrons plus loin la différence entre "atome" et "élément" au travers de la notion d'atome isotope.

La taille d'un atome varie de 0,25 à 3 Å (un ångström vaut cent picomètres et 1 pm = 10 -10 m) selon le type de matière (hydrogène, carbone, etc). Ainsi la taille d'un atome (ordre de 10-10 m) par rapport à un pamplemousse est du même ordre de grandeur que la taille d'une sphère de 1cm de diamètre par rapport à la Terre.

Les atomes ne se distinguent pas que par leur taille, mais aussi (et surtout) par leur structure.

Dans le modèle atomique l'atome est composé de particules (dites "subatomiques") :

  • un noyau, composé de deux types de "nucléons" :
    • protons :
      • charge électrique individuelle positive (1,602.10 -19 C = charge +1);

        Le coulomb est la charge électrique (la quantité d'électricité) traversant une section d'un conducteur parcouru par un courant d'intensité de un ampère pendant une seconde (1 C = 1 A*s).

      • masse individuelle = 1,673.10 -27 kg.
    • neutrons
      • sans charge électrique;
      • masse individuelle = 1,675.10 -27 kg.
  • d'un nuage entourant le noyau et composé d'électrons, qui sont des particules :
    • chargées négativement (charge -1);
    • de masse individuelle = 9,109.10 -31 kg soit 1838 fois moins lourde qu'un nucléon de sorte qu'elle est souvent ignorée dans les calculs des chimistes (et comme les électrons sont environ deux fois moins nombreux que les nucléons il en résulte que le noyau est environ 4.000 fois plus lourd que son nuage).

Quel que soit le type d'atome, les protons ont donc la même masse, de même que les neutrons.

Comme d'autre part la masse d'un proton est très proche de celle d'un neutron, on a simplifié la mesure en posant que la masse d'un nucléon (proton ou neutron) vaut une "unité de masse atomique" (u ou u.m.a.). Pour déterminer la valeur de cette u.m.a. on a choisi comme référentiel l'atome isotope 12C. Comme celui-ci comporte 12 nucléons on a donc que l'u.m.a. vaut un douzième de la masse de 12C soit 1,66 * 10 -27 kg :
1 u.m.a. = m12C / 12 = 1,66 * 10 -27 kg

Voir aussi supra : masse du nucléon Nu*mu à n_mole.

Le tableau suivant résume et simplifie ces propriétés des particules subatomiques.

Propriétés des particules subatomiques

ChargeMasse
p ++11
n 001
e --1négligeable

On notera que la masse d'un atome est donc concentrée dans le noyau (99,97%), tandis que sa charge est répartie, entre protons du noyau et nuage électronique. La concentration de masse est encore plus impressionnante lorsque l'on se rend compte que le rapport entre la taille du noyau et celle de l'atome est équivalent à celui entre la tête d'une fourmi et un terrain de football (ordre de grandeur du rapport : 1/100.000).

Taille (ordre de grandeur)

Atome10-10 m
Noyau10-15 m

Mais ce qui caractérise essentiellement un élément c'est le nombre de protons qu'il contient (NB : c'est un nombre entier), appelé numéro atomique (l'élément X de numéro atomique Z étant noté ZX). NB : la matière est généralement neutre c-à-d que la charge électrique d'un atome est nulle ⇒ Z indique donc également le nombre d'électrons.

Quant au nombre de nucléons (protons et neutrons) on l'appelle nombre de masse (noté A) ⇔ la masse d'un atome (masse atomique) vaut A u.m.a. (ainsi le rapport masse atomique / nombre de masse vaut exactement 1 pour 12C et est très proche de 1 pour tous les autres atomes).

triangle-clipedia.png Vidéo Clipedia : Tableau périodique
Tableau
périodique

Dans chaque case du tableau des éléments (cf. ci-dessous) le chiffre situé au-dessus du symbole de l'élément est son numéro atomique tandis que le nombre situé en dessous du symbole est la masse atomique. Le tableau "périodique" peut se lire notamment de gauche à droite c-à-d dans l'ordre des numéros atomiques. Les "périodes" sont les lignes, tandis qu'à chaque colonne est attribué un numéro de groupe (ainsi par exemple les éléments du groupe IA réagissent de façon assez semblable aux élément du groupe IB). Les dix familles d'éléments sont ainsi regroupées par couleurs.

tableau-periodique.png

Pour agrandir : clic droit sur l'image > Afficher > cliquer sur l'image pour agrandir au maximum.

L'atome d'hydrogène est le premier élément du tableau périodique (cf. infra) : c'est l'atome le plus petit, simple et léger : il est composé d'un seul proton, d'un seul électron et ne possède pas de neutron.

Description succincte des familles d'éléments :

  1. métaux alcalins (Li, Na, K, Rb, Cs, Fr) : réagissent fortement avec l'oxygène de l'air et de l'eau;
  2. halogènes (F, Cl, Br, I) : gaz diatomiques, et toxiques car il réagissent fortement (avec notamment les métaux alcalins);
  3. alcalino-terreux (Be, Mg, Ca, Sr, Ba, Ra) : il font les mêmes types de composés que les alcalins mais avec des taux de combinaison doubles;
  4. métaux de transition (Ti, Cr, Fe, Ni, Cu, Zn, Ag, Pt (catalyseur), Cd, Au, ...) : solides, conducteurs, ductiles, à haute température de fusion/ébullition, combinables entre eux (alliages), composables avec les non-métaux (oxydes, chlorures, sulfates, ...) en proportions diverses (exemple d'oxydes de fer : FeO, Fe2O3, F3O4) ;
  5. gaz nobles ou rares, inertes (He, Ne, Ar, Kr, Xe, Rn) : monoatomiques, très peu réactifs (ce qui en fait de bon gaz parfaits) --> ils forment peu de composés (d'où leur nom de inertes ou nobles);
  6. non métaux (C, H, O, N, P, S) : jouent un rôle déterminant dans le métabolisme des organismes vivants, légers (faible masse atomique), combinables (acides aminés – Ala, Tyr, ... – constituant les protéines, molécules de phospholipides constituant les membranes cellulaires, molécules d'ADN, ...);
  7. métalloïdes (B, Si, Ge, As, Sb, Te, At) : moins bons conducteurs que les métaux (⇒ utilisés pour fabriquer des semi-conducteurs, transistors et circuits intégrés);
  8. métaux pauvres (Al, Ga, Sn, Pb, ...);
  9. lanthanides ou "terres rares" (La, Pr, Nd, ...);
  10. actinides (U, Pu, Md, ...) : les plus lourds, matières premières des centrales nucléaires.

Les éléments récemment découverts sont les plus lourds : ils contiennent le plus grand nombre de protons. Découvrir de nouveaux éléments requiert de plus en plus d'énergie ⇒ au fur et à mesure que nous pourrons mobiliser de plus grandes quantités d'énergie grâce au progrès technologique découvrirons-nous sans fin de nouveaux éléments ?

Réaction chimique, mole

https://jortay.net/savoir-de-base#reaction-chimique

Il est théoriquement possible de transmuter la matière, par exemple le plomb (82Pb) en or (79Au) : pour cela il suffit d'enlever 82-79=3 protons à chaque atome de plomb. Cependant cela requiert tellement d'énergie que dans l'état actuel des technologies la transmutation est plus coûteuse que l'extraction. Cette anecdote est l'occasion de préciser que dès qu'on entre dans l'ingénierie nucléaire on sort du domaine de la chime pour entrer dans celui de la physique nucléaire. Le champs d'action de la chimie se situe plutôt au niveau du nuage électronique : une réaction chimique consiste en l'échange d'électrons entre atomes.

Une réaction chimique est un phénomène de transformation de la matière, que l'on observe dans certains cas lorsque l'on mélange des substances. Les composants se transforment ainsi en un ou plusieurs composants d'une autre nature (c-à-d avec des propriétés physico-chimiques différentes), cela tout en conservant la quantité de matière (cf. premier et second principes de la thermodynamique). Les réactions chimiques se distinguent notamment par leur intensité (on utilise parfois le terme de "violence") : ainsi par exemple lorsque l'on jette un morceau de sodium dans un récipient contenant de l'eau, le morceau de sodium se met à bouger en dégageant de la fumée, puis il brûle et enfin explose.

Autres exemples. Les organismes vivants sont le lieu de nombreuses et permanentes réactions chimiques, qui déterminent le métabolisme de ces organismes. Par exemple lorsque qu'un organisme se nourrit d'aliments ceux-ci réagissent avec l'oxygène de l'air et produisent ainsi de l'énergie (cf. respiration). Les réactions chimiques sont utilisée abondamment dans l'industrie, notamment pour produire des métaux à partir de minerais, ou des polymères (matières plastiques telles que le nylon). Les réactions chimiques sont également utilisée dans les stations d'épuration. Elles se produisent aussi à chaque fois que nous cuisinons (cf. réaction de maillard)

Revenons à la réaction de la vidéo, et écrivons son équation chimique :

Réactifs --> Produits
Na + H2O --> NaOH + H2

On constate que l'atome de Na prend la place d'un des deux atomes de H, qui est éjecté, ce qui produit une molécule d'hydroxyde de sodium et une molécule de dihydrogène (gaz). Cependant l'équation ci-dessus n'est pas correcte car le principe de conservation n'est pas respecté : on a plus d'atomes de H en produits qu'en réactifs ⇒ il faut diviser la molécule de dioxygène par 2 :

Na + H2O --> NaOH + 1/2 * H2

mais comme dans la réalité il n'existe pas de "demi-molécule" il faut alors multiplier les deux membres par 2 afin d'équilibrer correctement l'équation :

2Na + 2H2O --> 2NaOH + H2

reaction-chimique.jpg
triangle-clipedia.png Vidéos Clipedia : Mole // Mole : illustration
Mole

Les nombres situés à gauche des réactifs et produits sont appelés "coefficients stœchiométriques". Ils permettent de faire de la chimie quantitative. Celle-ci repose sur la notion de mole, qui permet d'établir un lien direct entre la masse d'une substance et le nombre de molécules qui la constituent, ce qui permet de quantifier correctement les réactifs d'une réaction données.

Pour définir la mole revenons à la notion de masse atomique. Nous avons vu que la masse d'un atome est représentée à plus de 99% par celle du noyau. Par conséquent la masse d'un atome vaut approximativement le produit du nombre de nucléons (Nu) par la masse d'un nucléon (mu) : matome ≈ mnoyau = Nu * mu.

Ce raisonnement vaut évidemment pour des molécules : par exemple mH2O ≈ Nu * mu que par convention on écrit mH2O = Nu * mu

Or il y a trois siècles le physicien et chimiste turinois Avogadro montra que 1g de n'importe quelle matière (par exemple le volume d'eau d'un dé à coudre) contient un nombre gigantesque de nucléons : 602.000 milliards de milliards ! C'est le nombre d'Avogadro :
NA = 6,022 * 1023.

Si un nucléon avait la taille d'une bille de 1cm de diamètre, NA nucléons rempliraient un cube dont l'arrête ferait 850km c-à-d que chaque face de ce cube aurait approximativement la taille de la France (PS : l'atmosphère s'arrête à environ 100km d'altitude ...).

Par définition une mole de nucléons c'est NA nucléons, donc par n_avogadro une mole de nucléons pèse 1g, ou encore 1g de n'importe quelle matière contient 1 mole de nucléons : NA * mu = 1g.

On a bien que mu = 1g / NA = 1g / ( 6,022 * 1023 ) = 1,66 * 10 -27 kg = 1 u.m.a. ⇔ mu ≡ u.m.a. n_u.m.a.

Que pèse une mole d'atome de carbone (par exemple) ?
Sachant que Nu*mu appliquée au carbone donne :
mC = 12 * mu
⇒ en substituant mu dans n_mole :
NA * mC = 12g

Ce raisonnement peut être appliqué à n'importe quel atome, en consultant le #tableau-periodique : soit un élément X de numéro atomique A, on défini sa masse molaire par :
NA * mX

On généralise au cas de n'importe quelle molécule en partant de l'application de Nu*mu à par exemple H2O :
mH2O = Nu * mu    ⇔
NA * mH2O = Nu * NA * mu    ⇔
NA * mH2O = Nu * 1g    ⇔
NA * mH2O = Nu g    ⇔
Masse molaire : M = Nu g

Molécule vs mole. Ainsi :

  • une molécule de H2O pèse Nu u.m.a.Nu est le total des nombre de masse associés à la molécule  ;
  • une mole de H2O pèse Nu g ;
  • ⇔ une mole de H2O contient bien Nu g / ( Nu u.m.a. ) = g / u.m.a. = NA molécules de H2O.

Appliquons maintenant la notion de mole à notre équation chimique supra :

- NA * mNa = 23g : une mole de Na pèse environ 23g;
- NA * mH2O = 18g : une mole de H2O pèse 2*1+16=18g
- NA * mNaOH = 40g : une mole de NaOH pèse 23+16+1=40g
- NA * mH2 = 2g : une mole de H2 pèse 2*1=2g

On peut associer coefficients stœchiométriques et nombre de moles d'une réaction :

2Na+2H2O2NaOH+H2
⇒ en multipliant les deux membres par NA :
2 moles Na+2 moles H2O2 moles NaOH+1 mole O2

Ne pas confondre Na (sodium) et NA (nombre d'Avogadro).

De sorte qu'à partir de n'importe quelle quantité de Na (par exemple 46g) on peut alors déterminer celles des autres réactifs et produits correspondant à l'équation.

2Na+2H2O2NaOH+H2
2 moles Na+2 moles H2O2 moles NaOH+1 mole O2
46g+36g80g+2g

On constate que 46+36=80+2. Ainsi la masse de matière est conservée (tout comme le nombre d'atomes).

On peut également déduire que :
18g de H2O contient 1 mole de H2O    ⇒
1g de H2O contient 1/18 mole de H2O = 0,055 mole de H2O = 0,055 * NA molécules de H2O.

Réaction
et énergie

Dans la réaction illustrée par la vidéo supra, ce n'est pas le sodium "qui a brûlé" (cf. vidéo) : la réaction produit du dihydrogène H2 qui réagit à son tour avec l'oxygène de l'atmosphère, en provoquant ainsi une réaction de combustion. Cette réaction chimique est donc associée à un dégagement d'énergie sous forme de chaleur, on parle alors de réaction exothermique :

2H2+O2-->2H2O (+ énergie)

La réaction de combustion peut prendre des formes très subtiles telles que la respiration évoquée plus haut.

molecule-H2O.png

Dans une molécule chaque liaison entre atomes se fait par mise en commun d'un électron. Chaque liaison, ou plus exactement chaque électron de la liaison peut-être vu comme détenteur d'une sorte d'énergie potentielle. Ainsi par exemple dans la réaction de synthèse de l'eau, une molécule de dihydrogène vient briser le lien qui unit les deux atomes du dioxyde, cela libère une énergie qui propulse la molécule de H2O synthétisée. La réaction de combustion correspond à une émission d'énergie (thermique et mécanique), de sorte que le produit d'une réaction exothermique correspond à un état énergétique inférieur à celui des réactifs, en vertu du principe de conservation.

Le graphique ci-dessous représente l'évolution du bilan énergétique d'une réaction. On voit que le pic correspondant à l'énergie d'activation peut-être abaissé, grâce à un catalyseur. Par exemple en ajoutant de la mousse de platine aux réactifs H2 et O2 on pourra déclencher la réaction avec seulement une échauffement plutôt qu'une explosion (la réaction est donc plus lente).

Réaction exothermique

reaction-exothermique.png

Notons qu'il n'y a pas de lien entre produit de la réaction et dynamique énergétique. Ainsi la glace qui fond est une réaction endothermique.

Réaction endothermique

reaction-endothermique.png

À noter également qu'il ne suffit pas toujours de mélanger des réactifs pour que la réaction se déclenche. Un apport d'énergie (électricité dans l'eau, flamme dans l'air, ...) peut être nécessaire : c'est l'énergie d'activation.

electrolyse-eau.png

Électrolyse de l'eau

On peut ainsi inverser le raisonnement illustré par le graphique énergétique ci-dessus : en fournissant de l'énergie on pourra provoquer une réaction chimique en ses inverse c-à-d produire du H2 et du O2 à partir de H2O. C'est ce qu'on appelle l'électrolyse de l'eau, qui est une réaction endothermique :

2H2O (+ énergie)-->2H2+O2

Le schéma ci-contre montre que le volume de gaz produit dans la colonne de droite est le double de celui de la colonne de gauche, ce qui correspond bien au rapport des coefficients stoechométriques du membre de droite : la réaction produit deux fois plus de molécules de H2 que de O2.

Dynamique

On voit que les réactions chimique se distinguent notament par leur vitesse : dans une explosion la réaction est quasiment immédiate tandis que dans d'autres phénomènes elle est beaucoup plus lente (par exemple la rouille sur un métal).

Cette observation nous conduit à la question : quel est le mécanisme d'une réaction chimique ? La dynamique du modèle atomique n'est pas immobile : les électrons tournent autour du noyau. Mais contrairement à la dynamique astronomique ces mouvements semblent chaotiques (aléatoires) de sorte qu'on ne parle pas d'orbite mais de probabilité de présence.

Une réaction chimique consiste dans la mise en commun d'électrons, ce qui requiert des chocs entre les atomes des réactifs (dans le cas de la dernière équation supra il faut que trois molécules se rencontrent : deux de H2 et une de O2). Or la probabilité de ces chocs diminue avec le nombre d'atome par unité volumique (concentration, pression) ainsi qu'avec l'agitation de ces atomes (liée à, et donc mesurée par la température). D'autre part on pourrait penser qu'une réaction chimique requiert également un positionnement ad hoc des atomes, ainsi qu'une mobilisation efficace de l'énergie nécessaire. Mais comme tout cela cela est statistiquement peu probable de se produire simultanément il faut donc trouver une autre explication. C'est ce qu'ont fait les prix Nobel de chimie 1956 Hinshelwood & Semenov. Dans leur théorie les molécules sont d'abord cassées en leur "radicaux libres" qui, ayant un nombre impair et donc un électron "isolé", vont réagir fortement avec les autres réactifs (avec nouvelles productions de radicaux), provoquant de complexes réactions en chaînes ⇒ l'explosion de la vidéo.

On peut ainsi distinguer :

  • thermodynamique chimique ⇔ notion d'énergie ⇔ dans quel sens se produit la réaction ?
  • cinétique chimique ⇔ notion de vitesse de réaction ⇔ pas de réaction < réaction modérée < explosion.

Masse et débit volumiques

https://jortay.net/savoir-de-base#masse-debit-volumiques
triangle-clipedia.png Vidéo Clipedia : La masse volumique
Masse
volumique

La masse volumique ρ est la masse par unité de volume :
ρ = M / V
Ainsi la masse volumique du bois de pin (0,45 kg/dm3) est inférieure à la masse volumique de l'eau (1 kg/dm3 = 1 g/cm3 = 1 t/m3... par convention !). Grâce au tableau périodique la comparaison de la masse volumique de l'aluminium et du plomb permet de donner l'explication atomique de la masse volumique. Ainsi le noyau du plomb contient dix fois plus de nucléons (270/27). Ce rapport est supérieur à celui des masses volumiques(11,4/2,7≈4,2) car les atomes de plomb sont plus volumineux.

De même la masse volumique de l'eau est inférieure à celle de l'aluminium car les molécules qui la composent sont plus volumineuses que les atomes d'Al tout en ayant moins de nucléons.

Maintenant comparons l'air à l'eau. L'air est composé de molécules d'oxygène (O2) et d'azote (N2) qui contiennent respectivement 32 et 28 nucléons (cf. tableau périodique). Pourtant l'air est manifestement plus léger que l'eau (sa masse volumique est inférieure : 1,3 g/dm3). La raison en est que les molécules d'oxygène et d'azote ne sont pas compactes (pas liées par des forces électriques) ⇔ il y en a moins par unité de volume. En effet l'air est un gaz.

La masse volumique est sensible à l'hétérogénéité du matériaux (exemple masse volumique de l'emmental) --> dans ce cas la masse volumique doit être considérée comme une grandeur moyenne. À l'extrême la masse volumique d'une machine n'a pas beaucoup de sens.

Enfin la masse volumique ne doit pas être confondue avec la densité, qui est, pour un même volume, le rapport entre la masse du matériaux et celle d'un matériaux de référence. Les volumes étant identiques la densité est donc le rapport des masse volumiques.

triangle-clipedia.png Vidéo Clipedia : Mesure et calcul de débits
Débit
volumique

Il importe de distinguer débit volumique DV = V / t et débit massique DM = M / t. Rappelons à cet égard qu'un litre représente un volume de 1.000 cm3 soit le volume d'un cube d'arrête de 10cm (⇒ 1 ml = 1 cm3), et qu'un litre d'eau pèse 1kg.

Une autre façon, tout aussi intuitive, de formuler le débit volumique est :
DV = S * v
S est la surface de la section du conduit, et v la vitesse du fluide dans ce conduit.

Démonstration :
DV = V / t =
S * L / t =
par définition de la vitesse v = L / t
S * v * t / t =
S * v
CQFD

Quant à la masse du débit massique on peut la calculer à partir de la masse volumique ρ :
DM = M / t = ρ * V / t.

⇒ on peut alors démontrer que DM = ρ * DV :
DM = ρ * V / t =
ρ * S * L / t =
ρ * S * v =
par n_debit-volumique :
ρ * DV
CQFD

N.B. On notera le lien intuitif entre M = ρ * V et DM = ρ * DV

Particules et électricité

https://jortay.net/savoir-de-base#particules-electricite
 6.5.1. Algèbre de l'électricité
 6.5.2. Électricité et matière
 6.5.3. Applications techniques
Algèbre de l'électricité
https://jortay.net/savoir-de-base#algebre-electricite

Lors du big bang, des neutrons – particules élémentaires instables par nature – se sont transformés en protons, particules élémentaires liées à des électrons par une force dite électrique. Cette force est, sous certains aspects, comparable à la force de gravitation (qui existe entre tous les corps, particules ou planètes)) : réciprocité entre les deux corps, fonction de la distance entre ceux-ci. Mais elle est aussi beaucoup plus forte (facteur 1040) et plus complexe : la force électrique entre particules semblables (protons ou électrons) est répulsive, alors qu'elle est attractive entre proton et électron. Pour modéliser mathématiquement ces propriétés on a convenu que le proton est de charge positive tandis que l'électron est de charge négative, le signe - correspondant à l'attraction et le + à la répulsion. Cette convention de signes permet l'utilisation d'une "algèbre de l'électricité" : - * + = - ; - * - = + ; + * + = +.

algebre-electricite.png

Ok, les types différents s'attirent. Mais qui va vers l'autre ? Réponse : tout est question de conventions ...

Électricité et interaction
https://jortay.net/savoir-de-base#electricite-interaction

Nous allons voir le rôle fondamental joué par l'électricité, via des forces d'attraction et répulsion :

  • dans la cohésion des atomes ;
  • dans les interactions dynamiques et chimiques entre atomes, qui peuvent expliquer le passage de matière inerte à matière vivante.

Les forces électrique (attractive) et gravitationnelle, en combinaison avec une force centrifuge, provoquent un mouvement orbital (à une vitesse beaucoup plus grande dans le cas de l'électron que de la lune, de l'ordre du millions de m/s).

Lorsqu'un proton et un électron se rencontrent deux options sont possibles : soit ils forme un neutron, soit ils forment un atome d'hydrogène (le plus simple des atomes : 1 proton et 1 électron).

Au-delà d'une certaine distance séparant deux atomes d'hydrogène, ceux-ci alors sont soumis à une force globale nulle (les forces d'attraction et répulsion des protons et électrons s'annulant).

molecule-hydrogene.png

Molécule d'hydrogène, composée de deux atomes d'hydrogène, donc de deux protons (en rouge) et deux électrons (en bleu).

Par contre en dessous de cette distance les forces d'attraction l'emportent sur les forces de répulsion ⇒ formation d'une molécule de (di)hydrogène. Dans le graphique ci-contre les vecteurs d'attraction (donc entre particules de signes différents) sont plus longs que les vecteurs de répulsion (entre particules de même signe), et la force d'attraction résultante est compensée par la force centrifuge du mouvement orbital des électrons.

À l'échelle supérieure des interactions inter-moléculaires il existe une force d'attraction entre molécules d'hydrogène, mais elle est faible de sorte que, dans les conditions physico-chimique de la surface de la Terre, des molécules de H2 qui entrent en collision ne provoquent généralement pas de réaction chimique, ce qui fait de H2 un gaz (molécules indépendantes l'une de l'autre).

Plasma. Les étoiles sont originellement des amas de gaz H2 dont la masse est tellement élevée que la force gravitationnelle devient supérieure aux forces électriques qui structurent chaque molécule de H2, de sorte que ces molécules sont brisées en protons et électrons. Cette "soupe" est appelée "plasma". Les mouvements de ces particules y sont permanents. Des neutrons sont alors formés par la rencontre de protons avec des électrons, et quand un neutron rencontre un proton on obtient un corps stable. Lorsque ceux-ci collisionnent entre eux on obtient des corps à deux protons et deux neutrons où les neutrons jouent le rôle de "colle" entre les protons, qui est la force nucléaire ou "interaction forte", beaucoup plus forte que la force électrique qui repousse les deux protons entre eux. À la surface de ces immenses corps qu'est l'étoile la force gravitationnelle est nettement plus faible (idem pour la pression et la température, cette dernière n'étant plus de quelques milliers de degrés) de sorte qu'elle redevient inférieure aux forces d'attraction électriques ⇒ des orbites électroniques apparaissent autour de ces corpuscules, formant ainsi des atomes d'hélium (qui diffèrent des atomes d'hydrogène en ce qu'ils possèdent des neutrons, de sorte que les protons sont liés).

etoile-usine.png

Neutrons en gris et protons en rouge. L'image ne peut représenter tous les nucléons (protons et neutrons) ainsi on peut constater dans le tableau périodique que l'atome d'oxygène contient 8 protons et l'atome de Na en contient 11. Les étoiles sont donc des "fabriques à atomes".

Par le même phénomène apparaissent tous les autres atomes repris dans le tableau périodique : des corps stables contenant des quantités différentes de protons et neutrons sont formés selon le même procédé que pour l'hélium, le nombre d'électrons (signe -) apparaissant étant égal à celui des protons (signe +). Ces électrons sont positionnés en couches composées de 2 électrons pour la première (la plus proche du noyau) et 8 par couche supplémentaire, sauf la dernière qui contient un nombre d'électrons inférieur ou égal à huit.

Ions. Si l'on prend par exemple deux atomes Na et Cl on constate que la dernière couche du Na ne contient que 11-2-8=1 électron et va avoir tendance à le perdre lorsqu'il rentre en contact avec un atome tel que Cl dont la couche extérieure contient 17-2-8=7 électrons (notion d'affinité électronique qui est fonction du nombre d'électrons en couche externe et de la distance entre celle-ci et le noyau). L'atome Na devient donc un ion Na+ tandis que l'atome Cl devient un ion Cl- (un atome est neutre tandis qu'un ion a une charge électrique non neutre). Étant de signes opposés ces ions Na+ et Cl- vont alors s'attirer et former des amas à structure symétrique que l'on appelle des cristaux (exemple le sel NaCl). Cette dynamique est complexe puisqu'elle opère autant au niveau des atomes que des molécules et des composés de molécules ...

H2O.png

H2O : interaction intra-moléculaire.

D'autre part on comparera utilement la formation de la molécule de NaCl avec celle de H2O. Dans ce dernier cas il n'y a pas transfert mais mise en commun d'électrons de deux atomes d'H avec une atome d'O de sorte que la dernière couche d'O (8-2=6) est complétée.

liquide.png

H2O : interaction inter-moléculaire.

Au niveau de leurs interactions inter-moléculaires on peut donc voir les molécules d'eau comme composées d'un ion O2- et de deux ions H+, de sorte que des amas de molécules de H2O vont se former en raison des forces d'attraction électriques intermoléculaires H+O2-. Celles-ci sont faibles en comparaison avec les forces d'attraction électriques intra-atomiques, de sorte que ces amas de molécules sont relativement instables. On les appelle des liquides.

Dans le cas de la molécule de silice SiO2 la force d'attraction intermoléculaire est beaucoup plus forte, il s'agit d'un solide, qui le sera d'autant plus si dans les interstices viennent s'imbriquer des atomes de calcium, formant ainsi des silicates (roches, grains de sables, ...).

Les mêmes interactions électriques sont à la base des molécules organiques, composées de C, O, H, N, ..., telles que l'ADN, molécule composée de milliards d'atomes, et contenant le code génétique des organismes vivants. Le nombre de combinaisons possibles est quasiment infini.

Enin les phospholipides sont des molécules en forme de "tête" avec deux "queues", celles-ci forment des chaînes avec d'autres molécules de phospholipides, constituant ainsi les membranes cellulaires. Les têtes peuvent s'emboîter les unes avec les autres, formant ainsi des êtres pluricellulaires. Tout cela par l'effet des forces d'attraction électriques.

La force électrique est donc à la base de la vie.

Applications techniques
https://jortay.net/savoir-de-base#electricite-techniques

Nous avons évoqué les mécanismes notamment microscopiques de l'électricité. Ce phénomène peut être facilement observé à l'échelle humaine en frottant un objet de cuivre (forte affinité aux électrons c-à-d forte propension à les attirer) avec un chiffon de coton (faible affinité), ce qui va provoquer un transfert d'électrons du chiffon vers le cuivre. Le premier étant ainsi chargé positivement (puisqu'il a perdu des électrons à partir d'une situation de charge neutre) et le second négativement (puisqu'il a gagné ces électrons à partir d'une situation de charge neutre) une force d'attraction apparaît entre les deux au point que le chiffon peut rester collé à l'objet de cuivre. Ce phénomène est appelé "électrisation".

Ce bloc de cuivre forme un réseau cristallin, comme le NaCl mais avec cette différence que ce réseau "cuivre" est formé par la mise en commun des électrons périphériques plutôt que par transfert d'électrons. L'agglomération d'atomes de Cu correspond à une libération des électrons périphériques qui jouent alors le rôle de colle entre les atomes de Cu. Si le nombre de ces électrons de cohésion devient très élevé alors les forces de répulsion entre eux peuvent avoir pour effet d'éjecter des électrons ("claquage électrique" formant un "arc électrique" communément appelé "éclair"). Ainsi le cuivre est dit "bon conducteur".

La notion de courant électrique apparaît ainsi, que l'on peut maîtriser et donc exploiter au moyen de diverses technologies :

  • en faisant passer un flux d'électron ("courant électrique") au travers d'un fil de cuivre, ces électrons bousculent les atomes de cuivres provoquant ainsi leur mouvement, ce qui génère de la chaleur (radiateur électrique) ; au-delà d'une certaine température le fil de cuivre va émettre de la lumière (ampoule électrique) ;
  • une centrale électrique peut créer du courant électrique grâce à une propriété importante des aimants : quand des électrons passent dans le champ magnétique généré par un aimant leur trajectoire est déviée par une force magnétique perpendiculaire (électromagnétisme) ;
  • dans une antenne des oscillations d'électrons sont entretenues sur sa longueur ⇒ via les forces de répulsion entre électrons de deux antennes distantes les mouvements au sein d'une antenne sont transmis à l'autre (NB : similitude avec le principe du levier) ⇒ on peut donc transmettre des forces électriques et donc des informations via ces ondes électriques.

Interaction

https://jortay.net/savoir-de-base#interaction

Le développement de connaissances concernant la composition de la matière et les techniques de calcul différentiel et intégral a ouvert le champs d'investigation des interactions entre les corps et les éléments qui les constituent.

 7.1. Électricité
 7.2. Loi de Gauss
 7.3. Potentiel
 7.4. Ondes gravitationnelles
 7.5. Optique

Électricité

https://jortay.net/savoir-de-base#electricite
 7.1.1. Loi de Coulomb
 7.1.2. Champs électrique
Loi de Coulomb
https://jortay.net/savoir-de-base#loi-coulomb

La loi de Coulomb décrit la force électrique exercée par deux charges q1 et q2 séparées par une distance r :
F(r) = kC * q1 * q1 / r 2
kC est la constante de Coulomb.

La force électrique (répulsive ou attractive) diminue donc avec le carré de la distance entre les corps chargés sur lesquels elle s'exerce.

On notera d'autre part que la force électrique a cette particularité – à priori peu intuitive – de ne pas se répartir entre les corpuscules sur lesquels elle s'exerce : c'est le principe de superposition de la force électrique, qu'exprime le produit q1 * q1.

electricite-superposition.png

Quelle est l'unité (ou "dimension") [ kC ] de kC ? Si l'on écrit l'équation n_force-de-coulomb en remplaçant tout par les dimensions on obtient :
N = [ kC ] * C2 / m2    ⇔
[ kC ] = N * m2 / C2    ⇔
Quelle est la valeur de kC ? Si q1=q1=1N et r=1m ⇒ on observe que F=8,99*109NkC = 8,99*109 N * m2 / C2, ce qui est énorme au regard de la charge d'un électron qe = 1,6 * 10 -19 C. Ainsi si l'on devait charger une bille de 10cm à 1C il y aurait tellement d'électrons dans cette bille que l'on observerait de très nombreuses expulsions d'électrons (éclairs).

Coulomb s'est évidemment inspiré de la loi de gravitation universelle, qui décrit la force de gravitationnelle FG = G * m1 * m1 / r 2 dont la constante de gravitation G (calculée par Cavendish) est énormément plus petite que kC.

Forme vectorielle. L'équation n_force-de-coulomb est la forme scalaire de la force électrique et est donc incomplète. Il convient également de pouvoir déterminer sa direction, au travers de sa forme vectorielle :

F = kC * q2 * q1 / r 2 * 1r

1r = ( r2 - r1 ) / || r2 - r1 || = ( r2 - r1 ) / r
est le vecteur direction (en norme) de la force exercée en q2, appelé vecteur unitaire radial ; ce vecteur est sans dimension (m/m=1) ; sa valeur se calcule par n_scalaires-additions et n_pythagore :
1r = ( x2 - x1 , y2 - y1 , z2 - z1 ) / √ ( ( x2 - x1 ) 2 + ( y2 - y1 ) 2 + ( z2 - z1 ) 2 )

N.B. Le vecteur unitaire radial est indépendant de la nature attractive ou répulsive de F. On le qualifie de radial car si l'on déplace l'une des deux charges autour de l'autre le VUR décrit le cercle correspondant.

Démonstration de n_force-de-coulomb-vector. L'axe des forces électriques agissant sur les charges q1 et q2 est l'axe déterminé par ces deux charges. Or le vecteur reliant celles-ci correspond à la définition de la différence de leurs vecteurs positions r1 et r2

F ∝ F * ( r2 - r1 )    ⇔
F est la valeur scalaire de n_force-de-coulomb
F ∝ F * 1r * || r2 - r1 ||    ⇒
F = F * 1r
F est le module de F

force-coulomb-vectorielle.png

On notera que les vecteurs F et -F sont toujours opposés, en vertu du principe de conservation de l'énergie.

Champs électrique
https://jortay.net/savoir-de-base#champs-electrique
triangle-clipedia.png Vidéo Clipedia : Le champ électrique

La notion de "radialité" du vecteur unitaire radial conduit à celle de champs électrique. Pour modéliser ce phénomène on va accentuer la différenciation entre q1 et q2 qui deviennent q et q0. Cette dernière est appelée "charge d'essai", pour illustrer une multitude de positions relativement à q, de sorte que la variation du vecteur r0 - rq dans l'espace décrit un volume centré sur q : le champs électrique.

Pour étudier ce champs électrique on veut donc que ce concept décrive uniquement l'environnement de q, indépendamment de la charge d'essai. Cela conduit alors naturellement à définir simplement le champ électrique par :
E = F / q0 = kC * q / r 2 * 1r où [E]=N/C.

Pour exprimer une charge négative (q ou q0) on remplace le symbole de la charge par sa définition du nombre négatif : x < 0 ⇔ x = - | x |

  • si q > 0 ⇒ E est de même signe que 1r ⇒ le champs est extraverti  ;
  • si q < 0 ⇒ E est de signe opposé à 1r ⇒ le champs est intraverti.
champs-electrique-3D.png

Partie droite : si q0 était positif alors le vecteur vert F serait orienté vers q, donc dans la même direction que E

Le calcul de E est facile puisque c'est une version simplifiée de F :

  • r - rq = ( x - xq , y - yq , z - zq )
  • r = √ ( ( x - xq ) 2 + ( y - yq ) 2 + ( z - zq ) 2 )
champs-electrique-calcul.png

Nous venons de modéliser la notion champ électrique d’une seule charge ponctuelle (champ coulombien). Nous allons maintenant modéliser la répartition du champ électrique généré par une paire de charges électriques. Pour ce faire nous considérons la force totale engendrée par ces deux charges q1 et q2 sur une charge d’essai q0.

champs-charges-multipes.png

Le graphique ci-contre montre que le principe de superposition que l'on avait constaté pour les forces électriques, vaut également pour les champs électriques :
F = F1 + F1 = q0 * ( E1 + E1 ) = q0 * E
⇒ on retrouve :
E = F / q0

Et le principe de superposition est évidemment applicable au cas de n particules positionnées arbitrairement :
E = ∑ nEi

Ainsi si l'on calcule les champs d'un nombre suffisant de charges d'essai on verra apparaître les "lignes de champs" qui caractérisent la répartition des champs. Le graphe suivante montre le cas de deux charges positives et égales.

champs-charges-positives.png

Dans le graphique suivant les deux charges sont toujours égales en valeur absolue mais de signes opposés (champs "dipolaire"). C'est typiquement le cas d'une molécule d'eau : le champs généré par une molécule de H2O est de type dipolaire, ce qui explique que l'eau se présente habituellement sous forme liquide. Autre application, cette fois artificielle : dans une antenne on a un courant oscillant (c-à-d qui va d'un côté à l'autre) de sorte que les extrémités constitueront généralement un dipôle oscillant. L'oscillation du courant dans l'antenne a pour effet que la configuration du champs oscille également, ce qui génère des ondes (dites électromagnétiques)

champs-dipolaire.png

Réalité. Dans le graphique ci-dessus considérons maintenant l'une des deux charges comme une charge d'essai (disons q2). Quel est alors la force exercée sur elle ? On pourrait être tenté de répondre à cette question en observant le champs dipolaire du graphique. Mais cela ne fait pas sens puisque par définition même du champs électrique la charge d'essai n'est pas reprise dans sa configuration. Autrement dit, on doit oublier le champs généré par la charge d'essai ⇒ il ne reste plus ici que q1 à considérer. Or cette charge génère un champs coulombien. Et comme on pourrait tenir le même raisonnement en intervertissant les rôles (q1 devenant charge d'essai) on doit en conclure que le champs électrique ne correspond à aucune réalité physique (ou, pour dire les choses plus prudemment : dans le cadre des connaissances scientifiques actuelles il est difficile de conclure que le champs électrique puisse correspondre à une réalité physique). En fait le concept de champs électrique, qui change selon la charge que l'on considère pour mesurer la force, n'est qu'un outil mathématique permettant de réaliser des calculs.

On peut enfin calculer des configuration de champs complexes, comme ci-dessous. Cependant dans la pratique la notion de champs est surtout utilisée pour caractériser des composants de circuits électriques tels qu'un condensateur, qui n'est autre qu'un couple de plaques de charges opposées (cf. champs dipolaire) ce qui génère un champs entre les plaques (qui va permettre de contrôler les courants et tensions dans le circuit). On notera à cet égard que le nombre de charges sur ces plaques est tellement élevé (des milliards voir des milliards de milliards) qu'il serait fastidieux d'utiliser E = ∑ nEi superposition pour réaliser ces calculs. Dans ce type d'application on utilisera alors d'autres méthodes de calcul.

champs-complexes.png

Loi de Gauss

https://jortay.net/savoir-de-base#loi-de-Gauss

La loi de Gauss permet de décrire les propriétés du champs électrique et gravitationnel, ou encore la façon dont la lumière se propage dans l'espace. C'est ce troisième cas que nous allons étudier dans la première section.

 7.2.1. Loi de Gauss : lumière
 7.2.2. Loi de Gauss : électricité
 7.2.3. Distribution de charge continue
 7.2.4. Forme locale et divergence
 7.2.5. Théorème d'Ostrogradski
 7.2.6. Méthode de Gauss : la sphère
 7.2.7. Méthode de Gauss : le cylindre
 7.2.8. Méthode de Gauss : le plan
Loi de Gauss : lumière
https://jortay.net/savoir-de-base#Gauss-lumiere
triangle-clipedia.png Vidéo Clipedia : La loi de Gauss : Introduction

La lumière est faite de particules appelées "photons" qui avancent dans l'espace à la vitesse de 300.000 km/s. La perception continue que nous avons de la lumière est due au très grand nombre de photons qui la composent (une ampoule classique en émet des milliards de milliards par seconde).

Flux

Une ampoule est caractérisés notamment par le nombre de photons émis par unité de temps : Φ = ΔN / Δt. Ce débit, multiplié par l'énergie des photons, détermine la puissance de la source lumineuse que constitue l'ampoule.

Source interne. Supposons que cette ampoule est entourée d'une sphère de verre parfaitement transparente (c-à-d qu'elle laisse passer tous les photons). Soit ΦS le nombre de protons passant au travers de cette surface sphérique ⇒ ΦS. On notera que cette mesure est indépendante de la taille et même de la forme de cette surface (dite "surface de Gauss") englobant la source lumineuse.

NB : Φ est le flux émis par la source, tandis que ΦS est le flux passant par la surface.

Source externe. Maintenant déplaçons cette surface de sorte qu'elle ne contient plus la source lumineuse ⇒ les photons y entrent puis en sortent (alors que dans le cas précédent ils ne faisaient qu'en sortir), ce que l'on exprime par : ΦS = 0 c-à-d un bilan net nul entre #photons entrants (Φe) et #photons sortants (Φs) :
ΦS = Φe + Φs = 0     ⇔
Φe = - Φs
c-à-d que, par convention, on considère le flux entrant comme négatif, et le flux sortant comme positif.

En résumé :

  • source interne à la surface de Gauss : le flux passant par la surface est égal à celui issu de la source : ΦS
  • source externe à la surface de Gauss : le flux passant par la surface est nul : ΦS=0

Maintenant plaçons-nous dans le cas de la source externe et enlevons comme un couvercle la surface correspondant au flux entrant. La question qui se pose alors est de savoir ce que vaut Φs c-à-d le nombre de photons passant au travers de cette surface ouverte.

film-savon.jpg

Film de savon bordé par un contour tordu

Mais attention, quand on parle de surface ouverte il faut surtout entendre "surface limitée par un contour", ce qui n'est pas le cas d'une sphère, qui est une surface fermée (sur elle-même). Pour le comprendre il suffit d'évoquer le soufflage de bulles de savons : tant que l'on souffle la "bulle" non décrochée est encore ouverte ... et le demeure lorsqu'on arrête de souffler, ce qui a pour effet que la surface presque sphérique redevient la surface dont la forme est déterminée par le contour de l'instrument.

Par convention on représente cette surface "en coupe", c-à-d vue de profil, ce qui donne une droite si la surface est plane.

comptage-photons.png

Densité
de flux

Supposons maintenant une source lumineuse émettant un faisceau parallèle. L'image ci-contre représente un volume ΔV contenant ΔN photons, passant à vitesse v au travers de la surface S pendant une durée Δt. D'autre part on suppose que la densité volumique des photons η = ΔN / ΔV est connue.

On a donc que :
• ΔV = v * Δt * S    [par n_vitesse]
• ΔN = η * ΔV

ΔN = η * v * Δt * S

ΦS = ΔN /Δt = η * v * S

Ce résultat intuitif montre donc que l'intensité du flux sur une surface S est déterminée par le produit densité*vitesse, que l'on appelle la "densité de flux" F = η * vΦS = F * SF = ΦS / S

La densité de flux mesure donc le flux par unité de surface. C'est la mesure de l'intensité de la lumière émise par la source.

comptage-photons-2.png

On va maintenant généraliser au cas d'une surface inclinée d'un angle θ (par rapport à la perpendiculaire au champs de photons). En outre cette surface est de forme carrée telle que S=L2. Le volume de Gauss devient donc :
ΔV = v * Δt * L * h    ⇔
ΔV = v * Δt * L * L * cosθ    ⇔
ΔV = v * Δt * S * cosθ    ⇒
ΔN = η * ΔV = η * v * Δt * S * cosθ    ⇒
ΦS = ΔN /Δt = η * v * S * cosθ    ⇔
ΦS = F * S * cosθ

Ainsi en comparant n_densite-flux et n_F*S*cosθ, cosθ (dont la valeur absolue est inférieure à égale à 1) apparaît comme un facteur de réduction de la surface suite à son inclinaison. En fait il s'agit de la réduction de la surface "de prise au flux" (qui est réduite à zéro si θ=π/2 ⇔ cos(θ)=0).

comptage-photons-3.png

Alternativement, en associant cosθ à v (ΦS = η * v * S * cosθ), on peut le voir aussi comme un facteur de réduction de la vitesse, car seule la composante normale (perpendiculaire à la surface) de la vitesse intervient dans le calcul du flux.

Cette remarque nous conduit naturellement à introduire la notation vectorielle : F = η * v de sorte que F caractérise le flux non seulement dans son intensité mais aussi sa direction.

F représente donc le champs vectoriel des photons.

vecteur-de-surface.png

Vecteur de
surface

Nous pouvons maintenant introduire une notion fondamentale de la loi de Gauss : le vecteur de surface S, normal à la surface (c-à-d perpendiculaire à celle-ci), et dont le module est cette même surface. Ce vecteur va permettre d'exprimer également l'orientation de la surface.

On arrive à cette notion de vecteur de surface en considérant que puisque θ est l'angle séparant F et S (tous deux sont perpendiculaires aux axes formant θ) on peut donc considérer ΦS = F * S * cosθ comme un produit scalaire n_produit-scalaire-trigono :

ΦS = F * S
S est appelé "vecteur de surface".

S * cos(θ) est donc la projection du module S sur la direction du flux F.

Surface quelconque. Étendons la généralisation en considérant maintenant une surface ouverte de forme quelconque. Ensuite découpons-là en damier de petites surfaces carrées telle que :
S = ∑n=1N ΔSn

vecteur-de-surface-2.png

Comme ces carrés peuvent être arbitrairement petits on peut alors approcher idéalement la surface ouverte quelconque. Chacun de ces petits carrés peut être représenté par son vecteur de surface, de sorte que leur somme est aussi vectorielle :
S = ∑n=1N ΔSn
⇒ on peut alors décrire le flux passant par chacun de ces petits carrés :
ΦΔSn = F * ΔSn
ΦS = ∑n=1NΦΔSn = ∑n=1N F * ΔSn    ⇔
ΦS = F * ∑n=1N ΔSn = F * S

On retrouve donc le même résultat que celui obtenu avec la surface carrée, de sorte que l'on peut faire le même type d'interprétation de cos(θ) : soit comme facteur de réduction de la surface suite à son inclinaison, soit comme facteur de réduction de F.

gauss-champs-non-uniforme.png

Champs non uniforme. Continuons la généralisation en considérant maintenant un champs non uniforme : la source émet maintenant dans toutes les directions, de sorte que F est variable sur la surface, ce que l'on va exprimer en le notant Fn. Mais alors la dernière égalité n'est plus valable car Fn ne peut plus être extrait de la somme puisqu'il dépend de n :
ΦS = ∑n=1NΦΔSn = ∑n=1N Fn * ΔSn

gauss-champs-non-uniforme-2.png

Si l'on perd en simplicité on gagne cependant en généralité car maintenant on va pouvoir supposer n'importe que forme pour la surface de Gauss ! Pour cela on va passer à la limite infinitésimale :
ΔSn → dSn    ⇒
ΦS = ∫s F * dS

NB : les indices n doivent être enlevés car ces dS sont en nombre infini, donc non énumérable.

gauss-champs-non-uniforme-3.png

Notons que la formulation ci-dessus est minimaliste : sa notation complète (mais rare) est plutôt : ΦS = ∫s F(r) * dS(r). C'est en effet le vecteur position r qui détermine un point particulier sur la surface de Gauss, auquel correspond un vecteur de surface dS(r) d'inclinaison particulière par rapport au champs F(r).

La surface de Gauss est fermée par définition. On le mentionne au moyen d'une notation spéciale de l'intégrale, dont le signe est maintenant affublé d'un petit cercle : ΦS = ∮s F * dS = Φ

Rappel : le flux émis par la source (Φ) est égal à celui passant par la surface (ΦS) dès lors que celle-ci englobe la source n_source-interne-externe.

gauss-source-interne.png

Par convention les physiciens on choisi que les vecteurs de surface d'une surface fermée sont sortants, que la source soit interne ou externe. Il en résulte qu'un flux sortant d'une surface fermée est toujours positif : car on a alors θ<π/2cos(θ)>0. En effet θ<π/2 puisque d'une part dS est perpendiculaire à la surface, et que d'autre part F ne peut former un angle supérieur à π par rapport à celle-ci, qui entoure la source.

ggauss-source-externe.png

Le graphique ci-contre illustre le cas d'une source externe. Les produits scalaires correspondant à la calote d'entrée sont négatifs car leur θ>π/2 ⇒ leur cos(θ)<0. La limite de cette calotte correspond au passage des cos(θ) de valeurs négatives à positives c-à-d au passage de θ>π/2 à θ<π/2 de sorte que ce point de passage est tel que θ=π/2 c-à-d la perpendicularité entre les deux vecteurs F (tangent à la surface, et sortant de celle-ci) et dS.

N.B. Étant donné la forme quelconque de la surface fermée, l'égalité Φe = - Φs n'est respectée que par la grande quantité de photons ou plus exactement en moyenne sur une certaine période.

Nous somme maintenant en mesure d'exprimer la loi de Gauss pour la lumière.

gauss-lumiere.png

Pour ce faire on va d'abord considérer deux sources à l'intérieur de la surface fermée. À un vecteur de surface dS sont donc associés deux vecteurs F1 et F2 tels que :
ΦS = ∮s ( F1 + F2 ) * dS    ⇔
ΦS = ∮s F1 * dS + ∮s F2 * dS    ⇔
ΦS = Φ1 + Φ2

Ce résultat est inchangé si l'on ajoute une source cette fois extérieure, et dont le flux est donc nul n_source-interne-externe. Par conséquent la loi de Gauss peut être formulée généralement par : ΦS = ∮s F * dS = ∑ Φint
où n'interviennent donc que les flux de sources internes à la surface de Gauss.

Considérons maintenant le cas d'une source lumineuse ponctuelle (que l'on peut voir comme une sphère de rayon infiniment petit) dont le débit de photons est Φ. Étant donné ΦS on veut calculer en tous points la valeur du champs vectoriel F( r). Pour simplifier la résolution mathématique de ce problème on va supposer que la source se situe au centre d'un espace fermé sphérique de rayon r. Dans ce cas les vecteurs de surface sont parallèles à leur densité de flux F n_densite-flux c-à-d que θ=0cos(θ)=1
ΦS = ∮ F(r) * dS
et en outre les F(r) sont constant en raison de la symétrie du système ⇒
ΦS = F(r) * ∮ dS    ⇔
ΦS = F(r) * S    ⇔ par n_surface-cercle :
ΦS = F(r) * 4 * π * r2
or
ΦS = Φ    ⇒
F(r) = Φ / ( 4 * π * r2 )    ⇔
F( r) = Φ / ( 4 * π * r2 ) * 1r
La densité de flux de photons est donc une " fonction vectorielle radiale (cf. 1r) en 1/r2 ".

On exprime ainsi l'intensité lumineuse en fonction de la distance à la source. Ainsi par exemple le rapport entre l'intensité lumineuse à la surface du soleil et celle de la Terre vaut :
Φ / ( 4 * π * RS2 ) / ( Φ / ( 4 * π * RT2 ) ) = RT2 / RS2 = 150.000.000 / 700.000 ≈ 46.000
⇔ le rayonnement du soleil est donc environ cinquante mille fois plus élevé au niveau du soleil qu'à celui de la terre.

Théorème
de Gauss

Le théorème de Gauss consiste en la démarche inverse : on part de n_champs-fonction-rayon pour aboutir à n_∑Φint : toute fonction radiale en 1/r2 obéit à la loi de Gauss. Démontrer cela est trivial dans le cas symétrique que l'on vient d'étudier : c'est juste le calcul inverse. Mais il reste à le démontrer dans le cas d'une surface de forme quelconque, c-à-d telle que r varie selon le vecteur de surface, et donc F(r) aussi. Dans ces conditions vérifier n_∑Φint exigerait un calcul intégral gigantesque.

surface-sphere.gif

Pour contourner cette difficulté la démonstration du théorème de Gauss décompose la sphère originelle en tubes de flux. Pour ce faire on commence par décomposer la surface en un nombre N de sections hexagonales, de sorte que ΔS = 4 * π * r2 / N.

gauss-theoreme.png

Coupe transversale d'une sphère recouverte de tubes de flux de longueur variable. .

On peut alors considérer des tubes de flux de longueur r'-r. La loupe illustre le fait que le flux passant au travers de la surface noir est le même que celui passant au travers de la section d'un tube de flux (en bleu) n_flux-est-produit-scalaire.

Le flux entrant d'un tube de flux (Φ / N) est égal au flux sortant (NB : ce n'est pas Φe / N = - Φs / N car la source de lumière est interne pour l'entrée et la sortie du tube : par "tube" on signifie bien qu'il ne s'agit pas d'une surface fermée).

Et comme la taille de ces sections peut être arbitrairement petite (et donc N arbitrairement élevé : on passe de ΔS à dS) on peut par conséquent représenter n'importe quelle forme de surface fermée !

Au total on a donc bien que ΦS = ∮s F * dS = ΦS représente une surface quelconque. CQFD.

gauss-theoreme-2.png

Coupe transversale d'une sphère recouverte de tubes de flux de longueur variable.

Le théorème de Gauss est accompagné d'un complément qui concerne le cas d'une source externe à une surface fermée, laquelle est analysée comme un agrégat de tubes de flux. Or nous avons vu que dans le cas d'une source externe ΦS est nul n_source-interne-externe.

Ce type de champs est appelé "à divergence nulle", concept intimement lié à la loi de Gauss, et qui traduit le fait que les photons traversent la sphère sans s'accumuler en son sein (ils la traverse à vitesse constante). C'est ainsi également le cas d'un champs électrique ou gravitationnel dans le vide.

Loi de Gauss : électricité
https://jortay.net/savoir-de-base#Gauss-electricite

Tous les phénomènes électro-magnétiques peuvent être décrits par ce système de quatre équations :

• ∇ * E = ρ / ε0
• ∇ * B = 0
• ∇ x E = - δB / δt
• ∇ x B = μ0 * J + μ0 * ε0 * δE / δt
où E représente le champs électrique et B le champs magnétique

Au terme de la section suivant celle-ci nous aurons montré que la première équation du système ci-dessus est la loi de Gauss (ici sous forme différentielle alors que dans la section précédente on l'a développée sous forme intégrale).

Repartons du théorème de Gauss :
F( r) = Φ / ( 4 * π * r2 ) * 1r   ⇒   ΦS = ∮s F * dS = Φ

L'égalité de gauche correspond à certains phénomènes physiques, qui peuvent être modélisés mathématiquement sous forme de fonction radiale en 1/r2 par rapport à un point déterminé de l'espace. C'est le cas du champs électrique.

On peut donc comparer :

  • champs de Gauss : champ de "densité de flux" de particules, émises par une source ponctuelle de débit Φ F( r) = Φ / ( 4 * π * r2 ) * 1r n_champs-fonction-rayon  et
  • champs de Coulomb : champs électrique dû à une charge ponctuelle E = kC * q / r 2 * 1r n_champs-electrique.

On utilise la dénomination E pour le champs électrique, et F quand la nature de la force n'est pas spécifiée.

Pour formaliser l'analogie entre ces deux équations il suffit de créer une variable Φq = 4 * π kC * q de sorte que la loi de Coulomb n_force-de-coulomb devient E = Φq / ( 4 * π * r 2 ) * 1r.

Le champs électrique peut donc être vu aussi comme une densité de flux de particules, à tel point que les charges électriques sont parfois appelées "photons virtuels".

On en déduit alors que le champs électrique obéit également à la loi de Gauss : ΦES = ∮s E * dS = ΦqΦES est donc le flux du champs électrique sur la surface fermée S. En particulier si la source est externe, alors le flux électrique net est nul par rapport à la surface fermée S.

Soulignons ici toute la puissance du théorème de Gauss n_theoreme-gauss : en substituant l'égalité de gauche dans celle de droite, on obtient une intégrale ΦES = ∮s Φq / ( 4 * π * r 2 ) * cos(θ) * dS dont le calcul requiert un ordinateur, mais dont le théorème de Gauss nous dit précisément que la solution est tout simplement Φq, et cela pour une surface quelconque !

La notion de débit de photons virtuel étant abstraite, on note ΦES en fonction de q plutôt que de Φq : ΦES = ∮s E * dS = 4 * π kC * q

Permittivité. Cette version de la loi de Gauss fut en outre simplifiée par le chercheur autodidacte Oliver Heaviside, qui introduisit la notion de permittivité du vide ε0 = 1 / 4 * π * kC = 8,85*1012 C2/(N*m2), analogie avec la permittivité de l'air, qui est une propriété d'élasticité permettant d'expliquer la propagation des ondes acoustiques dans l'air ⇒
s E * dS = q / ε0
qui est la version moderne de la loi de Gauss pour le champs électrique.

De la même manière la forme moderne de la loi de Coulomb exprime le champs électrique en fonction de la permittivité plutôt qu'en fonction de la constante de Coulomb : E = kC * q / r 2 * 1r n_champs-electrique qui devient E = q / ( 4 * π * ε0 * r 2 ) * 1r .

Électrodynamique. Nous avons considéré jusqu'ici le cas de charges statiques (électrostatique). Mais lorsque l'on considère que les charges ne sont pas fixes (ce qui est généralement le cas dans le monde physique), on doit prendre en compte le fait que cette dynamique ne se propage pas instantanément sur le champs (temps de propagation des photons virtuels). Or ce retard a pour effet de supprimer la propriété de radialité : le champs n'est plus dans l'axe situé entre la charge et le point de calcul. Il en résulte que la loi de Coulomb n'est plus valable (contrairement à la loi de Gauss, qui le demeure).

champs-electromagnetique.gif

Cette animation montre que lorsqu'un corps chargé se déplace, le champs électromagnétique qu'il génère n'est pas déplacé en bloc mais de proche en proche [source].

Charges négatives. Dans le cas du champs E généré par une charge négative -|q|, celui-ci est orienté vers la charge (cf. #champs-electrique) ⇔
θ > π / 2 ⇒ ΦES = ∮s E * dS < 0
On le démontre trivialement en remplaçant q par -|q| dans s E * dS = q / ε0 n_Gauss-permittivite.

Gauss-charges-multiples.png

Charges multiples. La loi de Gauss devient s E * dS = ∑ qn / ε0, dont la démonstration est triviale :
ΦES = ∮s E * dS =
s ( ∑n En ) * dS =
ns En * dS =
∑ qn / ε0
CQFD

Gauss-charges-externes.png

Charges externes. Enfin la prise en compte de charges externes est également triviale. Le graphique suivant illustre le fait que le champs généré par les charges externes modifie le champs généré par les charges internes. On montre que le résultat est cependant sans effet, en prenant le cas d'une charge externe qm :
ΦES = ∮s E * dS =
s ( ∑ En + Em ) * dS =
ns En * dS + ∮s Em * dS
or par n_source-interne-externe :
s Em * dS = 0    ⇒
ns En * dS + ∮s Em * dS =
ns En * dS =
∑ qn / ε0
CQFD
Autrement dit, seules interviennent les charges internes dans la loi de Gauss, que l'on peut donc énoncer comme suit : « l'intégrale de flux d'un champs électrique sur une surface fermée est donnée par la somme des charges que contient cette surface, divisée par la permittivité du vide » .

Distribution de charge continue
https://jortay.net/savoir-de-base#Gauss-distribution-continue

Nous allons ici généraliser la loi de Gauss pour les distributions de charges continues. Cette notion est illustrée par une expérience d'électrostatique consistant à accumuler des charges de signes oppposés dans deux boules, jusqu'à ce qu'un certain seuil soit dépassé, provoquant un "claquage" : l'air s'ionise et créé ainsi le passage d'un courant d'une boule vers l'autre, ce que l'on observe sous la forme d'un arc électrique. On va étudier ici ce qui se passe dans ces boules avant le claquage : dans chaque boule la charge est statique de sorte que l'on peut appliquer la loi de Gauss.

À l'échelle microscopique les ions du réseau cristallin constituant la matière métallique de la boule sont entourés d'électrons en agitation thermique. Les ions sont également en agitation thermique mais beaucoup plus faible, de sorte qu'on peut les considérer comme relativement immobiles : il bougent autour d'une position d'équilibre, tandis que les électrons forment un nuage réparti dans l'ensemble du volume de la boule. Le mouvement des électrons n'est pas ordonné tant qu'il n'y a pas de courant. Mais en moyenne, dans le volume déterminé par la boule, on peut considérer que la position des charges est constante. Pour que cette condition soit vérifiée il suffit que le nombre de charges soit constant en moyenne. On est alors dans les conditions de la loi de Gauss : ensemble discret de charges statiques.

Formellement on doit préciser que seules les charges internes sont prises en considération : s E * dS = ∑nint qn / ε0

Cependant la réalité est dynamique plutôt que statique. Pour adapter le modèle à cette dynamique il faut introduire la notion de distribution de charges continue. Il s'agit de partitionner l'espace en petits cubes de volumes identiques ΔV, et dans lesquels les conditions de l'électrostatique (ensemble discret de charges statiques ⇔ ∄ courant) sont vérifiées en moyenne (notamment les sorties d'électrons hors de chaque cube sont compensées en moyenne par des entrées).

Ainsi à chaque ΔV est associée une quantité de charges (ions + électrons) ΔQ = ∑n  qn. Chacun des cubes est considéré comme chargé c-à-d de charge totale non nulle : #charges+ ≠ #charges-.

Gauss-distribution-continue.png

Densité
volumique

On introduit alors la notion de densité volumique de charge :
ρ = ΔQ / ΔV [C/m3] .

Pour exprimer le fait que ρ varie d'un cube à l'autre (et donc aussi ΔQ puisque ΔV est identique pour tous les cubes) on va identifier chacun de ceux-ci au moyen d'un vecteur position :
xm = ( xm , ym , zm )    ⇒
ρ(xm) = ΔQm / ΔV    ⇔
ΔQm = ρ(xm) * ΔV    ⇒
dans n_∑qn/ε0 on remplace alors le terme qn (représentant les charges élémentaires) par ΔQm (représentant la charge contenue par chaque cube) :
s E * dS = 1/ε0 * ∑mint ΔQm    ⇔
mintΔQm est la somme des charges contenues par les seuls volumes contenus dans l'espace déterminé par la surface fermée S
s E * dS = 1/ε0 * ∑mint ρ(xm) * ΔV
qui est une somme discrète ⇒ pour passer à la distribution de charge continue on va considérer que ΔV → 0ΔV = dV
• la variable discrète xm devient une variable continue x ;
• la somme discrète mint devient une intégrale VS, calculée sur le domaine du volume V enfermé par la surface S :
s E * dS = 1/ε0 * ∫vs ρ(x) * dV

Lecture : le membre de gauche est l'intégrale d'un flux E sur une surface fermée ( ∮s ), tandis que le membre de droitre est l'intégrale d'une densité de charge ρ(x) dans un volume ( ∫vs ), ce volume étant celui contenu dans la surface fermée.

NB : les points situés entre la surface de Gauss (S) et la surface de l'objet, c-à-d là où il n'y a pas de charge, sont tels que ρ(xm) = 0.
Forme locale et divergence
https://jortay.net/savoir-de-base#Gauss-local-divergence
triangle-clipedia.png Vidéo Clipedia : Loi de Gauss : forme locale

La forme continue de la loi de Gauss s E * dS = 1/ε0 * ∫VS ρ(x) * dV n_gauss-continu n'est pas locale : elle met en relation des points de la surface fermée (membre de gauche) avec des points à l'intérieur de cette surface fermée (membre de droite).

Nous allons ici développer la version locale de la loi de Gauss : div(E) = ρ(x) / ε0
qui met en relation E et ρ(x) en un même point (déterminé par le vecteur position x), et implique la notion de divergence.

Pour passer de la version continue n_gauss-continu à la version locale n_gauss-local on considère une surface fermée de forme cubique, que l'on réduit à un volume infinitésimal entourant un seul point.

Pour ce faire nous allons devoir faire ici une parenthèse sur le traitement des intégrales calculées sur de très petits intervalles. Commençons à une dimension (c-à-d une seule variable).

integrale-petit-interval.png

Le graphique ci-contre illustre le fait que lorsque l'intervalle δ tend vers zéro, le segment de la courbe f(x) qu'il détermine peut être considéré comme une droite. Dans ces conditions, le point situé au milieu de cet intervalle détermine deux triangles identiques :
• en vert au-dessus de la ligne horizontale hachurée, dans la partie droite de l'intervalle ;
• en blanc en-dessous de la ligne horizontale hachurée, dans la partie gauche de l'intervalle.

On voit alors que la valeur de l'intégrale limδ→0x0–δ/2x0+δ/2 f(x) * dx (la surface en-dessous de la courbe) est égale à la surface du rectangle δ * f(x0).

Ce résultat se généralise facilement au cas de deux dimensions : dans le graphique supra x0, point central de la base du rectangle dont la surface représente l'intégrale, devient dans le graphique suivant (x0,y0), point central de la base d'un parallélépipède rectangle dont le volume (membre de droite suivant) représente l'intégrale (membre de gauche suivant) : limS→0S f(x,y) * dS = δ2 * f(x0,y0)
dS=dx*dy

integrale-petit-interval-2.png
Fermons ici cette parenthèse sur le traitement des intégrales calculées sur de très petits intervalles, et revenons à notre démonstration du passage de :
s E * dS = 1/ε0 * ∫VS ρ(x) * dV : forme continue de la loi de Gauss ;
à :
div(E) = ρ(x) / ε0 : forme locale de la loi de Gauss.

La première partie de cette démonstration concerne le membre de droite de la forme continue : si l'espace fermé de forme cubique est réduit à un point (déterminé par le vecteur) x, alors ρ(x0) peut être sorti de l'intégrale :
limvS→0s E * dS = limvS→0 1/ε0 * ρ(x) * ∫VS dV    ⇔
limvS→0s E * dS = limvS→0 1/ε0 * ρ(x) * VS    ⇔
limvS→0s E * dS = 1/ε0 * ρ(x0) * δ 3

La seconde partie de la démonstration, plus longue et calculatoire, concerne le membre de gauche de la forme continue. S'agissant d'une intégrale de flux nous allons donc calculer ce flux sur toutes les surfaces du cube.

gauss-local.png

Commençons par celle du haut (NB : le dS ne représente pas celle-ci mais une surface infinitésimale) : nous la dénommons Sz car orientée en z
dS = dS * 1z   ⇒
sz E * dS =
sz E * dS * 1z =
sz E * 1z * dS =
sz Ez(x,y,z0+δ/2) * dS =
par n_integrale-petit-intervalle :
Ez(x0,y0,z0+δ/2) * δ 2

Passons maintenant à l'autre surface orientée en z. Elle est telle que :
dS = - dS * 1z   ⇒ ... ⇒
sz E * ( - dS * 1z ) =
...
- Ez(x0,y0,z0-δ/2) * δ 2

Passons maintenant aux deux surfaces orientées en y :
dS = dS * 1y   ⇒ ... ⇒
sy E * dS * 1y =
...
Ey(x0,y0+δ/2,z0) * δ 2

Et ainsi de suite de suite, de sorte que le calcul des six faces donne finalement que :
1/ε0 * ρ(x0) * δ 3 =
( Ez(x0,y0,z0+δ/2) - Ez(x0,y0,z0-δ/2) ) * δ 2 +
( Ey(x0,y0+δ/2,z0) - Ey(x0,y0-δ/2,z0) ) * δ 2 +
( Ex(x0+δ/2,z,y00) - Ex(x0-δ/2,y0,z0) ) * δ 2    ⇔
1/ε0 * ρ(x0) =
( Ez(x0,y0,z0+δ/2) - Ez(x0,y0,z0-δ/2) ) / δ +
( Ey(x0,y0+δ/2,z0) - Ey(x0,y0-δ/2,z0) ) / δ +
( Ex(x0+δ/2,z,y00) - Ex(x0-δ/2,y0,z0) ) / δ

Or chacun des trois membres de cette somme n'est autre qu'une dérivée partielle "au centre", qui n'est qu'une variante de la traditionnelle dérivée partielle "à droite" :
δf / dx =
limδ→0 ( f(x+δ) - f(x) ) / δ =
limδ→0 ( f(x+δ/2) - f(x-δ/2) ) / δ

de sorte que :

1/ε0 * ρ(x0) =
δEx / dx |x0,y0,z0 + δEy / dy |x0,y0,z0 + δEz / dz |x0,y0,z0

qui est bien la version locale recherchée, exprimant x0 en fonction de (x0,y0,z0) ⇔ ρ et E ne sont considérés qu'en un seul point de l'espace. Et comme celui-ci peut se situer n'importe où dans l'espace le zéro est en fait inutile ⇒
1/ε0 * ρ(x) =
δEx / dx + δEy / dy + δEz / dz ≡ div(E)

Divergence

Cette somme des dérivées partielles des composantes d'un champs est appelée "divergence du champs" et notée div(E) (E pour le champs électrique, F quand le type de champs n'est pas spécifié).

Or nous avons d'autre part que :
1/ε0 * ρ(x) =
1/ε0 * ρ(x) * δ 3 / δ 3 =
par n_gauss-lim :
limVS→0 1 / δ 3 * ∮s E * dS    ⇔
limVS→0 1 / VS * ∮s E * dS = 1/ε0 * ρ(x) = div(E)

On obtient alors l'interprétation physique : « la divergence en un point représente le flux normalisé du champ vectoriel sur une surface fermée de taille infinitésimale entourant ce point ("normalisé" signifiant ici "divisé par le volume enfermé par la surface fermée") ».

On notera qu'en supprimant le passage à la limite et en faisant passer VS dans le membre de droite on retrouve l'interprétation de la loi de Gauss sous sa forme intégrale :
s E * dS = 1/ε0 * ρ(x) * VS    ⇔
s E * dS = 1/ε0 * ρ(x) * ∫vS dV

Enfin comprenons bien la différence entre définition mathématique (générale) et interprétation physique (particulière) de la divergence :

  • div(E) ≡ δEx / dx + δEy / dy + δEz / dz n_divergence-math est la définition strictement mathématique de la divergence ;
  • div(E) = limVS→0 1 / VS * ∮s E * dS = 1/ε0 * ρ(x) n_divergence-physique en est une interprétation physique.

Application. Soit le champs :
E(x,y,z) = a * y2 * 1x + 2 * a * x * y * 1y    ⇒
div(E) = 2 * a * x    ⇒
ρ(x) = ε0 * div(E) = ε0 * 2 * a * x

Cas particulier : dans le vide ρ(x) = 0 ⇒ div(E) = 0.

Nabla. On obtient enfin la forme la plus fréquente de la loi de Gauss en appliquant la notation nabla, qui permet de simplifier la définition de la divergence :
= δ / dx * 1x + δ / dy * 1y + δ / dz * 1z     ⇒ soit :
E = Ex * 1x + Ey * 1y + Ez * 1z     ⇒
* E = δEx / dx + δEy / dy + δEz / dz    ⇔
div(E) = ∇ * E

* E = 1/ε0 * ρ

Théorème d'Ostrogradski
https://jortay.net/savoir-de-base#Gauss-Ostrogradski
triangle-clipedia.png Vidéo Clipedia : Théorème d’Ostrogradski

Ce théorème, qui relie flux et divergence, énonce que « l'intégrale de flux d'un champs vectoriel F sur une surface fermée F est donnée par l'intégrale de la divergence de ce champs sur le volume VS enfermé par cette surface » : s F * dS = ∮vS div(F) * dV.

La démonstration s'obtient à partir du système d'équation exprimant le passage de la forme continue à la forme locale de la loi de Gauss:

s E * dS = 1/ε0 * ∫VS ρ(x) * dV n_gauss-continu
à :
div(E) = ρ(x) / ε0 n_gauss-local

En isolant ρ(x) dans n_gauss-local et en le substituant dans n_gauss-continu ⇒ annulation des deux ε0
s E * dS = ∮vS div(E) * dV

On note le champs E dans le cas du champs électrique, et F lorsqu'on ne spécifie pas de quelle type de champs il s'agit.

Comprenons bien le caractère étonnant du théorème d'Ostrogradski :
s F * dS = ∮vS div(F) * dV
: alors que le membre de droite concerne tous les points constituant le volume, le membre de gauche ne concerne que les valeurs de F à la surface de ce volume. Il en résulte un fait à priori contre-intuitif : quelle que soit la situation (orientation) des champs à l'intérieur du volume – situation qui détermine la valeur de div(F) – l'intégrale de ces div(F) est constante (et vaut la valeur donnée par le membre de gauche).

Nous allons montrer que la nature a priori contre-intuitive de ce résultat n'est qu'apparente. Mais avant il est utile d'approfondir notre compréhension intuitive de la divergence, en montrant que son interprétation physique :
div(F) = limVS→0 1 / VS * ∮s F * dS n_divergence-physique
recouvre bien sa définition mathématique :
div(F) ≡ δFx / dx + δFy / dy + δFz / dz n_divergence-math.

ostrogradski.png

Pour ce faire on va prendre le cas de la composante en x de la définition mathématique. À celle-ci correspondent les deux faces du cube orientées en x. La somme des flux passant par ces deux faces est donnée par n_Ez(x0,y0,z0-δ/2)*δ2 :
∫  2sx F * dS = Fx(x+δ/2,y,z) * δ2 - Fx(x-δ/2,y,z) * δ2    ⇔
∫  2sx F * dS = [ Fx(x+δ/2,y,z) - Fx(x-δ/2,y,z) ) ] * δ2    ⇔
∫  2sx F * dS = [ Fx(x+δ/2,y,z) - Fx(x-δ/2,y,z) ) ] / δ * δ3    ⇔

où l'on constate que la partie surlignée en jaune correspond bien à la définition d'une dérivée (centrée) : le différentiel de valeur d'une fonction entre deux points séparés d'une distance δ, divisé par δ (de sorte que le δ2 du numérateur devient δ3). Quant à y et z, ils sont constants : on circule sur la ligne reliant les trois points x-δ/2x, x et x+δ/2.

Pour passer à la surface totale du cube il faut prendre en compte les deux autres paires de surface, orientées en y et z. Cette généralisation est triviale puisqu'il y a symétrie en x, y et z ⇒
s F * dS = [ δFx / δx + δFy / δy + δFz / δz ] * Vs    ⇔
1/Vs * ∮s F * dS = [ δFx / δx + δFy / δy + δFz / δz ]    ⇔
1/Vs * ∮s F * dS = div(F)
où l'on retrouve bien n_divergence-physique.

Poursuivons l'interprétation physique de la divergence en analysant le cas d'une dérivée partielle positive. Cela signifie que le flux entrant est plus petit que le flux sortant (cf. graphique supra). Or le flux entrant étant négatif et le flux sortant positif n_source-interne-externe, il en résulte que le flux net est positif. L'approche mathématique de dérivée partielle positive est donc bien cohérente avec l'interprétation physique de flux normalisé net qui est positif.

Fermons cette parenthèse sur l'interprétation intuitive de la divergence, et étudions de plus près le théorème d'Ostrogradski. Nous allons montrer que le théorème contient l'interprétation physique de la divergence. Il suffit pour cela de faire tendre VS vers zéro ⇒ div(F) ne varie qu'infiniment peu ⇒ elle peut être considérée comme constate, et donc extraite hors de l'intégrale :
s F * dS = ∮  vS→0 div(F) * dV   ⇔
s F * dS = div(F) * ∮  vS→0 dV   ⇔
s F * dS = div(F) * VS   ⇔
1/ VS * ∮s F * dS = div(F)
où l'on retrouve bien n_divergence-physique.

Venons-en maintenant à l'objectif que nous nous étions fixé au début de cette section : montrer que le caractère contre-intuitif du théorème d'Ostrogradski n'est qu'apparent. Pour ce faire on va faire la démarche inverse à celle que l'on vient de présenter : retrouver le théorème à partir de la définition/interprétation physique de la divergence.

Pour ce faire on va décomposer le volume VS petits cubes de volume ΔVn et de surface Sn tels que n=1,2,3,...,N. On a alors que, pour chaque petit cube de vecteur position xn :
div(F)|xn = limΔVn→0 1/ ΔVn * ∮sn F * dS

ostrogradski-intuitif.png

Le graphique ci-contre représente les champs situés au milieu des six faces d'un cube. Il illustre le fait que pour chaque cube il y aura six calculs à effectuer.

On fait passer ΔVn dans le membre de gauche ⇒ :
div(F)|xn * limΔVn→0 ΔVn = ∮sn F * dS   ⇒
n=1Ndiv(F)|xn * limΔVn→0 ΔVn = ∑n=1Nsn F * dS   ⇔
∫  vS div(F) * dV = ∑n=1Nsn F * dS

NB : avec la notation intégrale le |xn est implicite.

ostrogradski-intuitif-2.png

La conversion du membre de droite en intégrale semble plus problématique car la somme qui y est représentée prend en compte toutes les surfaces de tous les cubes, or l'intégrale de surface ne doit prendre en compte que les seules surface externes. Mais en réalité le problème ne se pose pas. Pour s'en rendre compte prenons le cas de deux cubes adjacent Sn-1 et Sn. Leurs faces connexes ont une contribution au flux qui est nulle car leurs dS respectifs sont égaux en valeur absolue (puisque qu'ils correspondent à un même point de champs) mais de signes opposés (puisque le flux est rentrant dans un cas et sortant dans l'autre) ⇒ les produits scalaires correspondant s'annulent.

ostrogradski-intuitif-3.png

Vue en coupe ⇒ seuls 4 dS par cube sont représentés.

Paradoxe résolu ! Et c'est évidemment cette propriété qui dissipe l'apparente contre-intuitivité du théorème d'Ostrogradski : quelle que soit la valeur des F internes (norme et direction), ceux-ci sont de toute façon annulés !

On peut donc passer à l'intégrale dans le membre de droite :
∫  vS div(F) * dV = ∑n=1Nsn F * dS   ⇔
∫  vS div(F) * dV = ∮s F * dS n_ostrogradski
⇔ l'intégrale de la divergence sur un volume est donné par l'intégrale de flux de la fonction sur la surface qui limite ce volume. Il s'agit là d'un outil de calcul mathématique très utilisé en physique.

Méthode de Gauss : la sphère
https://jortay.net/savoir-de-base#methode-gauss-sphere
triangle-clipedia.png Vidéo Clipedia : Méthode de Gauss : la sphère

Nous allons montrer ici que la loi de Gauss s E * dS = 1/ε0 * ∫VS ρ(x) * dV n_gauss-continu permet de calculer le champs électrique E du membre de gauche à partir de la distribution de charges qui en est à l'origine (membre de droite). Cette technique est appelée "méthode de Gauss". Nous allons l'illustrer ici par le cas d'un sphère chargée avec une densité volumique de charge ρ n_densite-volumique-charge constante (dans l'espace et le temps). Cette distribution de charge génère partout dans l'espace un champs électrique E( x), considéré au vecteur position x.

Pour calculer ce champs on pourrait utiliser la formule du champs de Coulomb E = q / ( 4 * π * ε0 * r 2 ) * 1r n_coulomb-permittivite. Une charge q contenue dans un volume infinitésimal peut être considérée comme ponctuelle. La loi de Coulomb permet alors de calculer la valeur du champs généré par cette charge en un point située à une distance r.

gauss-sphere-coulomb.png

Pour connaître r il suffit de connaître la position des deux points dans un référentiel arbitraire. Le graphique ci-joint montre comment, par construction, on trouve que :
• r = || x - x' || ;
• 1r = ( x - x' ) / || x - x' ||.

E = q / ( 4 * π * ε0 ) * ( x - x' ) / || x - x' ||3

On peut alors reconstituer la sphère par intégration de ces petits cubes, chacun générant sont propre champs en x ⇒ en sommant ces champs on obtient le champs généré par la sphère en x (principe de superposition). À chaque vecteur position x' est ainsi associé un volume infinitésimal dV' dont la charge est alors donnée par le produit de ce volume par la densité volumique ρ : ρ * dV'. Dans l'égalité précédente cette charge infinitésimale remplace donc la charge ponctuelle q ⇒ :
... = ρ * dV' / ( 4 * π * ε0 ) * ( x - x' ) / || x - x' ||3
et si la charge est infinitésimale (c-à-d arbitrairement petite), il en va de même pour le champs qu'elle génère ⇒ il faut remplacer E par dE :
dE = ρ * dV' / ( 4 * π * ε0 ) * ( x - x' ) / || x - x' ||3
⇒ le champs généré par la sphère est donc :
E = ∫ dE = ∫ ρ * dV' / ( 4 * π * ε0 ) * ( x - x' ) / || x - x' ||3    ⇔
E = ∫ dE = ∫ ρ(x') / ( 4 * π * ε0 ) * ( x - x' ) / || x - x' ||3 * dV'    ⇔
où l'on précise que la charge volumique ρ(x') n'est pas constante en toutes généralités (NB : ne pas confondre la sphère chargée et la surface de Gauss qui l'entoure).

Cependant le calcul de cette intégrale de volume complexe n'est pas du tout aisé. Heureusement, la loi de Gauss s E * dS = 1/ε0 * ∫VS ρ(x) * dV n_gauss-continu permet de développer une méthode de calcul nettement plus simple, appelée "méthode de Gauss".

gauss-sphere.png

Dans le graphique ci-contre la surface de Gauss S et le volume qu'elle renferme VS sont représentés en blanc. Dans l'équation ci-dessus on constate que le champs E que l'on souhaite calculer se trouve à l'intérieur d'une intégrale. Comment faire pour l'isoler dans le membre de gauche ? Pour répondre à cette question considérons le cas général 0L f(x) dx = I. On ne peut le résoudre en f(x) que si l'on considère cette fonction comme constante f(x)=f
f * ∫0L dx = I    ⇔
f * L = I    ⇔
f = I / L
La méthode de Gauss est fondée sur ce principe : faire en sorte que l'intégrante E soit une constante. Et pour ce faire on va choisir une surface de Gauss qui a cet effet. Intuitivement on devine que cette surface induit la symétrie de la distribution des charges, et qu'en l'occurrence il s'agit donc d'une sphère centrée sur, et entourant, la sphère chargée.

gauss-sphere2.png

Le graphique ci-contre, qui représente la sphère en 2D, montre que le champs d'une distribution de charges sphérique et uniforme (paires de charges diamétralement opposées relativement au rayon passant par le point de champs x) est radial, c-à-d situé sur le rayon correspondant, et donc perpendiculaire à la surface de Gauss ⇒ les dS sont parallèles aux E, ce qui va simplifier le calcul du produit scalaire du membre de gauche de n_gauss-continu. Et comme la sphère de Gauss est centrée sur la sphère chargée il en résulte que les modules E(r) des champs E sont égaux en tous points de la surface de Gauss :
• E = E(r) * 1r
et il en va de même de leurs vecteurs de surface :
• dS = dS * 1r
de sorte que :
E * dS = E(r) * dS    ⇒
s E * dS = ∮s E(r) * dS    ⇒
NB : le caractère vectoriel (et donc variable) de l'intégrale a disparu ⇒
s E * dS = E(r) * ∮s dS    ⇒
s E * dS = E(r) * S    ⇒
s E * dS = E(r) * 4 * π * r2

Il reste à calculer le membre de droite de s E * dS = 1/ε0 * ∫VS ρ(x) * dV n_gauss-continu. Attention, ρ est considérée comme constante dans toute la sphère chargée, mais cela n'implique pas que ρ(x) est constante dans la sphère de Gauss ("le volume VS enfermé par la surface de Gauss S"), qui englobe la sphère chargée. Cependant, dans l'espace différentiel c'est le vide ⇒ ρ = 0 ⇒ l'intégrale de droite, qui concerne la sphère de Gauss (de rayon r), peut être ramenée à la seule sphère chargée (de volume VSc et rayon R) ⇒
1/ε0 * ∫VS ρ(x) * dV = 1/ε0 * ∫VSc ρ * dV    ⇔
1/ε0 * ∫VS ρ(x) * dV = 1/ε0 * ρ ∫VSc dV    ⇔
1/ε0 * ∫VS ρ(x) * dV = 1/ε0 * ρ * VSc    ⇔
1/ε0 * ∫VS ρ(x) * dV = 1/ε0 * ρ 4/3 * π * R3

de sorte que par n_E(r)*4*πr2, n_1/ε0*ρ4/3*π*r3 et n_gauss-continu :
E(r) * 4 * π * r2 = 1/ε0 * ρ 4/3 * π * R3    ⇔
E(r) = ρ * R3 / ( 3 * ε0 * r2 )    ⇔
E = ρ * R3 / ( 3 * ε0 * r2 ) * 1r    ⇔
E = ρ * VSc / ( 4 * π * ε0 * r2 ) * 1r    ⇒ par n_densite-volumique-charge :
E = Q / ( 4 * π * ε0 * r2 ) * 1r
où l'on retrouve donc le champs coulombien n_coulomb-permittivite c-à-d généré par une charge ponctuelle. C'est là un résultat remarquable, et à priori contre-intuitif : le champs est indépendant du rayon de la sphère chargée (ce qui est pratique pour modéliser des corps dont la taille peut être associée à un point, tels que des électrons).

Rappelons cependant que cette équivalence entre lois de Coulomb et de Gauss n'est valable que dans un système statique; Dès que la charge bouge, la loi de Coulomb n'est plus valable (contrairement à la loi de Gauss, qui est donc plus générale). Mais nous verrons également que la méthode de Coulomb demeure incontournable dans des situations statiques non symétriques.

Interprétations habituelles :
• on retrouve la relation en 1/r2 que l'on avait déjà observée dans le cas d'une charge ponctuelle : plus on s'éloigne de la charge, plus le champs diminue ;
• le champs augmente avec la charge Q, ce qui est également intuitif.

Approfondissons maintenant l'analyse en étudiant le cas où r < R c-à-d lorsque le volume de Gauss est à l'intérieur de la sphère chargée. Étant donné la symétrie du système cela n'a pas d'impact sur le membre de gauche n_E(r)*4*πr2, mais concernant le membre de droite il faut y remplacer R par rn_gauss-sphere-1 devient :
E(r) = ρ * r3 / ( 3 * ε0 * r2 ) * 1r    ⇔
E(r) = ρ / ( 3 * ε0 ) * r * 1r
NB : on a donc plus la relation en 1/r2 !

En résumé :

gauss-sphere3.png

Le graphe de la fonction E(r) illustre la croissance linéaire pour r ≤ R, suivie d'une décroissance en 1/r2 lorsque r devient supérieur à R.


Méthode de Gauss : le cylindre
https://jortay.net/savoir-de-base#methode-gauss-cylindre

Dans la section précédente concernant l'application de la méthode de Gauss à une sphère chargée, nous avons vu que la méthode requiert d'identifier une surface de Gauss symétrique. Si la réponse est évidente dans le cas d'une sphère, elle l'est moins dans le cas d'un cylindre.

gauss-cylindre.png

Tant que l'on se situe au niveau du milieu de la longueur du cylindre chargé, il y a symétrie : le champs est perpendiculaire à l'axe du cylindre chargé. D'autre part cette perpendicularité (et partant la symétrie) est d'autant moins approximable que l'on se rapproche d'une extrémité ou l'autre.

Par conséquent, si l'on considère un cylindre chargé de longueur H (en vert sur le graphique ci-contre), et un point externe situé à la surface d'un cylindre de Gauss (en bleu) de longueur h < H et de rayon r, entourant le cylindre chargé, alors il existe au moins une valeur du ratio ( H - h ) / r au-dessus de laquelle on peut considérer que le champs généré par le cylindre chargé à la surface du cylindre de Gauss est en tous points perpendiculaire à l'axe central. C'est l'option que nous appelons symétrie localisée (et en l'occurrence "centrée").

Un autre option est celle de symétrie infinie : on considère ici une situation purement théorique (idéalisée) où H = ∞ de sorte que la symétrie n'est plus localisée, c-à-d qu'on peut la considérer en tout point de l'espace.

Quelle que soit l'option analytique choisie, ∮ étant une intégrale fermée, il faut prendre en compte la surface latérale SL ainsi que celle des deux bases du cylindre de Gauss : S = SL + SB
s E * dS = ∫sL E * dS + ∫sB E * dS

Notez que dans le membre de droite ce ne sont plus des intégrales de surface fermée.

gauss-cylindre-2.png

Concernant sL E * dS, le graphique ci-joint montre la situation vue du dessus : il y a bien une symétrie radiale par rapport à l'axe du cylindre, et les vecteurs de surface dS sont parallèles à leur champs E. Dans ces conditions, leur produit scalaire est égal au produit de leurs modules.

gauss-cylindre-3.png

Concernant sB E * dS, le graphique ci-contre montre que si les deux bases sont choisies telles que perpendiculaires à l'axe du cylindre ⇒ chaque vecteur de surface est perpendiculaire à son champs, de sorte que leur produit scalaire est nul.

Au total on a donc que :
s E * dS = ∫sL E * dS + ∫sB E * dS    ⇔
s E * dS = ∫sL E * dS    ⇔
s E * dS = E * ∫sL dS    ⇔
s E * dS = E * SL    ⇔
s E * dS = E(r) * 2 * π * r * h

gauss-cylindre-4.png

Pour terminer l'application de la méthode de Gauss, intéressons-nous maintenant au membre de droite de la loi de Gauss s E * dS = 1/ε0 * ∫vS ρ(x) * dV n_gauss-continu. Rappelons qu'il s'agit de la charge totale à l'intérieur du volume de Gauss VS. Quant à la densité de charge ρ(x) elle est considérée comme constante (uniformément répartie) dans le cylindre chargé, mais cela n'implique pas qu'elle l'est également dans le cylindre de Gauss ("le volume VS enfermé par la surface de Gauss S"), qui englobe le cylindre chargé. Cependant, dans l'espace différentiel c'est le vide ⇒ ρ = 0 ⇒ l'intégrale de droite, qui concerne le cylindre de Gauss (de rayon r), peut être ramenée au seul cylindre chargé (de volume VSc et rayon R), où ρ(x) = ρ ⇒
1/ε0 * ∫vS ρ(x) * dV = 1/ε0 * ρ ∫vSc * dV    ⇔
1/ε0 * ∫vS ρ(x) * dV = 1/ε0 * ρ VSc    ⇔
1/ε0 * ∫vS ρ(x) * dV = 1/ε0 * ρ * π * R2 * h

De sorte que par n_E(r)*2*π*r*h, n_1/ε0*ρ*π*R2*h et n_gauss-continu :
E(r) * 2 * π * r * h = 1/ε0 * ρ * π * R2 * h    ⇔
E(r) = ρ * R2 / ( 2 * ε0 * r )    ⇔
E(r) = ρ * R2 / ( 2 * ε0 * r ) * 1r

Interprétation :
• le champs est indépendant de la longueur h du cylindre de Gauss ;
• le champs (externe) diminue en 1/r, alors que dans le cas de la sphère il diminuait en 1/r2 ⇔ la décroissance est moins rapide ;
• alors que dans le cas de la sphère la radialité était définie par rapport au centre de la sphère (r est la distance par rapport à ce point), dans le cas du cylindre elle est défini par la perpendiculaire à l'axe du cylindre (r est la distance par rapport à cet axe) ;

Densité
linéique

Dans le cas de la sphère on retrouvait le champs Coulombien (charge ponctuelle) en exprimant le champs en fonction de la charge totale Q plutôt qu'en fonction de la densité de charge ρ. A-t-on le même résultat dans le cas du cylindre ? :
par n_densite-volumique-charge :
Q = ρ * π * R2 * H    ⇔
ρ * R2 = Q / ( π * H )   ⇒ substitué dans n_gauss-cylindre-1
E(r) = ( Q / H ) / ( 2 * π * ε0 * r ) * 1r   ⇒
soit λ = Q / H = ρ * π * R2 la densité linéique de charge :
E(r) = λ / ( 2 * π * ε0 * r ) * 1r

De sorte que ni le rayon R ni longueur H du volume chargé n'interviennent. Dès lors, de même que la sphère chargée pouvait être théoriquement réduite à un point, le cylindre peut être théoriquement réduit à un fil rectiligne infini.

Enfin, le cas que nous venons d'analyser est tel que le rayon r du cylindre de Gauss est supérieur à celui R du cylindre chargé. Mais qu'en est-il du champs à l'intérieur du cylindre uniformément chargé, c-à-d qu'en est-il du champs tel que r < R ? Cette situation ne changeant rien à la symétrie, rien n'est changé concernant n_E(r)*2*π*r*h. Et dans n_1/ε0*ρ*π*R2*h il faut juste remplacer R par r
E(r) * 2 * π * r * h = 1/ε0 * ρ * π * r2 * h    ⇔
E(r) = ρ * r / ( 2 * ε0 )    ⇔
E(r) = ρ * r / ( 2 * ε0 ) * 1r

En résumé :

gauss-cylindre-5.png

Le graphe de la fonction E(r) illustre la croissance linéaire pour r ≤ R, suivie d'une décroissance en 1/r lorsque r devient supérieur à R.

Physiquement le graphe ci-dessus peut être illustré comme dans le graphique ci-dessous : à l'intérieur du cylindre chargé le module du champs est croissant (linéairement) tandis qu'en dehors il est décroissant (en 1/r).

gauss-cylindre-6.png

Enfin le graphique suivant compare les deux cas idéalisés : un fil de longueur infinie dans le cas du cylindre (gauche), et un point dans celui de la sphère (droite). On notera que le schéma de droite peut être interprété comme celui de gauche vu d'en haut. La différence étant l'épaisseur du cylindre, qui semble pouvoir expliquer (N.d.A.) le degré inférieur de l'exposant en r : dans les deux cas on a certes une diminution de densité, horizontalement, lorsqu'on s'éloigne du centre, mais dans le cas du cylindre la densité a une seconde dimension, verticale, qui elle ne diminue pas avec la distance au centre.

gauss-cylindre-7.png

Méthode de Gauss : le plan
https://jortay.net/savoir-de-base#methode-gauss-plan
triangle-clipedia.png Vidéo Clipedia : Méthode de Gauss : le plan

L'application de la loi de Gauss trouve une application notamment dans le cas de circuits électriques tels qu'un condensateur, qui n'est autre qu'un couple de plaques de charges opposées (cf. champs dipolaire), ce qui génère un champs entre les plaques (qui va permettre de contrôler les courants et tensions dans le circuit).

gauss-plan-1.png

On considère ici le cas d'une plaque uniformément chargée avec une densité volume de charge ρ n_densite-volumique-charge. On comprend déjà intuitivement qu'à l'instar du cylindre ce système ne présente pas la symétrie d'une sphère chargée, et que par conséquent cette symétrie devra être considérée comme localisée en le centre de la plaque, ou non localisée en supposant une plaque de superficie infinie. En effet, d'une part le champs en un point situé sur la perpendiculaire au centre d'une plaque carrée est confondu avec cet axe.

gauss-plan-2.png

D'autre par on peut considérer qu'il existe une certaine distance x à une plaque de surface L*L, en-dessous de laquelle les points sources proches du bord n'ont pas d'impact significatif sur le point de champs considéré, de sorte qu'il existe une zone centrée sur le centre de la plaque et dans laquelle le champs est uniforme c-à- identique en tout point, et en l'occurrence perpendiculaire à la plaque.

Comme dans les deux cas précédent cette limitation de symétrie locale pourra être levée en considérant le cas théorique d'une plaque de surface infinie.

gauss-plan-3.png

La configuration du système impose logiquement la forme du volume de Gauss : celui-ci doit contenir le flux et induire une symétrie maximale ⇒ c'est donc le cylindre qui s'impose. Le membre de gauche de la loi de Gauss s E * dS = 1/ε0 * ∫vS ρ(x) * dV n_gauss-continu se décompose donc à nouveau en deux intégrales de surface (non fermées) : surface latérale (SL) et celle des deux bases (2*SB) :
s E * dS = ∫sL E * dS + ∫sB E * dS
sur la surface latérale les vecteurs de surface sont perpendiculaires à leur champs ⇒ leur produit scalaire est nul, tandis que sur les bases ils leurs sont parallèles ⇒ leur produit scalaire est égal au produit de leurs normes, ⇒

gauss-plan-4.png

s E * dS = ∫sB E * dS    ⇔
s E * dS = E * ∫sB dS    ⇔
s E * dS = E * 2 * SB

Traitons maintenant le membre de droite de la loi de Gauss s E * dS = 1/ε0 * ∫vS ρ(x) * dV n_gauss-continu. C'est une intégrale de volume calculant la charge intérieure à la surface de Gauss, c-à-d la charge de la portion de plaque chargée contenue dans la surface de Gauss, ⇒ par n_densite-volumique-charge :
1/ε0 * ∫vS ρ(x) * dV = 1/ε0 * ρ * e * SB

De sorte que par n_E*2*SB, n_1/ε0ρ*e*SB et n_gauss-continu :
E * 2 * SB = 1/ε0 * ρ * e * SB    ⇔
E = ρ * e / ( 2 * ε0 )   ⇔
E(x) = ρ * e / ( 2 * ε0 ) * 1

NB : 1 = - 1x vers la gauche, et 1 = 1x vers la droite !

Interprétations :
• le champs ne dépend pas de la surface de la plaque ;
• le champs (externe) ne dépend pas de sa distance x à la plaque : quelle que soit la distance à laquelle on se trouve de la plaque chargée le champs est constant !

Exprimons maintenant le résultat en fonction de la charge plutôt que de la densité de charge : par n_densite-volumique-charge :
Q = ρ * e * S    ⇔
ρ * e = Q / S     ⇒ substitué dans n_gauss-plan-1 :
E(x) = Q / S / ( 2 * ε0 ) * 1   ⇒
soit σ = Q /S = ρ * e la densité surfaçique de charge :
E(x) = σ / ( 2 * ε0 ) * 1

De sorte que ni l'épaisseur e ni la surface S de la plaque n'interviennent. Dès lors, de même que la sphère chargée pouvait être théoriquement réduite à un point, et le cylindre à un fil rectiligne infini, la plaque peut l'être à un plan d'extension infinie et infiniment mince.

Enfin, le cas que nous venons d'analyser est tel que le champs est à l'extérieur de la plaque, mais qu'en est-il à l'intérieur ? Cette situation ne changeant rien à la symétrie, rien n'est changé concernant n_E*2*SB. Et dans n_1/ε0ρ*e*SB il faut juste remplacer e par 2*x
E * 2 * SB = 1/ε0 * ρ * 2 * x * SB    ⇔
E = ρ / ε0 * x   ⇔
E(x) = ρ / ε0 * x * 1

Ainsi alors que le champs était indépendant de x en dehors de la plaque, ce n'est plus le cas dans celle-ci (on avait donc raison de faire preuve de prudence dans n_gauss-plan-1, en mentionnant E(x) plutôt que E). En particulier le champs est nul si x=0 c-à-d lorsqu'on on se situe au milieu de la plaque, ce qui est logique puisque cette situation est symétrique.

gauss-plan-5.png

On notera une continuité (intuitive) dans la dépendance du champs externe à la distance r au volume chargé, selon la forme idéalisée de celui-ci :
• source ponctuelle (dim=0) : dépendance en 1/r2 ;
• source linéaire (dim=1) : dépendance en 1/r1 ;
• source plan (dim=2) : dépendance en 1/r0=1 c-à-d indépendance ;
que l'on peut généraliser par source de dim = n ⇒ dépendance en 1 / r (2-n).

Dans le cas du plan, le résultat à priori contre-intuitif de non dépendance du champs externe par rapport à la distance n'est qu'apparent :
horizontalement (c-à-d dans le sens du flux) : pas de radialité horizontale, donc pas de baisse de densité lorsqu'on s'éloigne du centre ;
verticalement (c-à-d perpendiculairement au flux) : il y a une épaisseur de flux de sorte que la densité est logiquement constante dans l'espace.
Mais rappelons-nous que ces résultats ne valent que pour une distance proche du corps chargé : au delà on retrouvera une dépendance tendant vers 1/r2 au fur et à mesure que la distance grandit c-à-d que l'objet chargé devient petit relativement à celle-ci.

Potentiel

https://jortay.net/savoir-de-base#potentiel
 7.3.1. Potentiel gravitationnel
 7.3.2. Gravitation universelle
 7.3.3. Potentiel électrique
 7.3.4. Loi d'Ohm
 7.3.5. Champs quelconque
Potentiel gravitationnel
https://jortay.net/savoir-de-base#potentiel-gravitationnel
triangle-clipedia.png Vidéo Clipedia : Le potentiel : introduction 1

Nous allons étudier ici la notion de potentiel gravitationnel, qui permet de décrire les aspects énergétiques du champs gravitationnel, par exemple le fait qu'un boule dévalant une pente acquiert ainsi une énergie cinétique.

Quelle vitesse faut-il imprimer à une boule située au bas d'une pente de longueur et pente déterminées pour qu'elle en atteigne le sommet ? Pour résoudre ce problème, commençons par identifier la loi physique générale auquel ce problème fait référence. En l'occurrence il s'agit de la loi de conservation de l'énergie : l'énergie ne se créé ni ne se perd, elle ne peut que se transformer d'une forme en une autre. Ainsi l'énergie cinétique que la boule acquiert en dévalant la pente n'est en réalité que la transformation de l'énergie potentielle qui lui a été conférée par le travail qu'il a fallu exercer pour l'amener en haut de la pente.

potentiel-gravitation.png

Énergie
potentielle

Ensuite il s'agit d'identifier la loi particulière à ce problème. En l'occurrence il s'agit du fait que le travail à fournir pour élever une masse m à une hauteur h est indépendant de l'angle que fait avec le sol la pente par laquelle la masse est élevée (c-à-d indépendant de la longueur du chemin choisi) :

W = F * L n_travail    ⇒ par n_F=m*a et n_projection1 :
W = ( m * g * sinθ ) * L    ⇔
W = m * g * ( sinθ * L )    ⇔
W = m * g * h    ⇔
W = m * g * z
(z est souvent utilisé pour exprimer une variable de hauteur, et h pour exprimer une donnée de hauteur).

Si vous ne comprenez pas la signification de la projection m*g*sinθ de m*g, revoir la section #vecteur-produit-scalaire (PS : on utilise ici le sinus plutôt que le cosinus car l'angle θ est ici l'inclinaison par rapport au sol plutôt que par rapport à la verticale).

En vertu du principe de conservation ce travail est donc stocké dans la boule, sous forme d'énergie potentielle Ep telle que :
ΔEp = W = m * g * z

Ce processus est évidemment réversible : si cette boule est ensuite relâchée au sommet de la pente à une vitesse initiale nulle, alors elle se met à dévaler la pente, en transformant son énergie potentielle en énergie cinétique Ec = m * v2 / 2    n_energie-cinetique, c-à-d en acquérant de la vitesse (ici à accélération constante). Donc, à nouveau le principe de conservation :
| Δ Ep | = | - Δ Ec |    ⇔
m * g * z = m * v2 / 2    ⇔
v = √(2 * g * z)
Ainsi pour toute hauteur z, on peut calculer la vitesse correspondant v(z) (g étant donnée). Et v(z=h) est donc donc la vitesse qu'il faut imprimer à la boule immobile en bas de la pente pour l'y amener au sommet.

Si on fait abstraction des forces de frottement ⇒ la vitesse maximale de la boule qui arrive en bas de la pente reste constante ⇒ on est dans un MRU ⇒ la boule continue indéfiniment sur sa lancée (et on aurait eu également un MRU sur le plateau si la vitesse initiale en bas de la pente avait été supérieure à v(z=h) ). Autrement dit, la vitesse minimale à imprimer pour le trajet bas-haut est la vitesse maximale à la fin du trajet haut-bas, dans le cas d'une boulée lâchée à une vitesse initiale nulle.

Un résultat à priori contre-intuitif de v = √(2 * g* z) n_v=√(2*g*z) est que cette vitesse est indépendante de la masse : quelle que soit celle-ci, la vitesse initiale sera identique pour l'amener en haut de la pente ! On voit que la vitesse ne dépend que du produit g * z, que l'on appelle "potentiel gravitationnel" (noté VG), et que l'on définit plutôt en fonction de l'énergie potentielle équivalente au travail fourni pour gagner ce potentiel :
Ep = W = m * g * z    n_energie-potentielle
VG = Ep / m = g * z [J/kg]
qui est donc l'énergie potentielle par unité de masse, caractérisant ainsi le champs gravitationnel dans sa dimension énergétique : à chaque hauteur z correspond une valeur de VG, laquelle est indépendante de la masse de l'objet considéré (puisque, précisément, c'est l'énergie potentielle par unité de masse). Ainsi pour connaître l'énergie potentielle d'un corps à une hauteur z, il suffit de multiplier sa masse par le potentiel gravitationnel correspondant à cette hauteur.

Découle alors logiquement de la notion de potentiel, celle de différence de potentiel entre deux niveaux de hauteur, qui permet de procéder à des bilans énergétiques. Ainsi le travail à fournir pour déplacer une masse entre deux niveaux quelconques – c-à-d l'énergie potentielle ΔEp ainsi gagnée – vaut m * ΔVGΔVG = VGf - VGi (f pour "final" et i pour "initial").

N.B. La hauteur (en m, km, ...) à laquelle on place le zéro de l'échelle du potentiel (en J/kg) n'a donc aucune importance (notamment, le potentiel zéro ne doit pas nécessairement correspondre à la hauteur zéro) : ΔVG = m * ( zf - zi )zf et zi sont les hauteurs finale et initiale.

Application. Le skieur de 80kg qui a dévalé une pente quelconque, et dont l'altitude a ainsi baissé de 3m, a perdu une énergie potentielle de 80 * ( 10 - 40 ) = 80 * ( 0 - 30 ) = ... = -2.400J, laquelle s'est transformée en différentiel d'énergie cinétique de même valeur absolue mais de signe opposé.

potentiel-gravitation-2.png

Ainsi pour le trajet haut-bas, le travail fournit est négatif c-à-d que l'on reçoit du travail (principe des barrages hydroélectriques). Cependant, la notion de travail négatif étant peu intuitive, on parle plutôt de différence négative d'énergie potentielle.

Ainsi le principe de conservation de l'énergie se formule par :
ΔEp + ΔEc = 0    ⇔
mΔVG + ΔEc = 0

Bilan énergétique. La notion de potentiel gravitationnel vient ainsi compléter celle de champs (d'accélération) gravitationnel : alors que le vecteur accélération g caractérise le champs gravitationnel (vectoriel et uniforme) dans sa dimension de force (F = m * g), le potentiel gravitationnel peut être vu comme un champs (scalaire) qui caractérise le champs gravitationnel dans sa dimension énergétique (Ep = m * VG).

Gravitation universelle
https://jortay.net/savoir-de-base#gravitation-universelle

Dans la section précédente g est considéré comme une donnée c-à-d une constante. Nous allons ici étudier la nature de cette constante, et ainsi constater que cette donnée est relative aux référentiels planétaires, via la masse et le rayon de celles-ci.

triangle-clipedia.png Vidéo Clipedia : Le potentiel : introduction 2

La force de gravitation universelle :
f = - m * G * M / r 2 * 1r
où :
• M = masse de la planète ;
• G : constante de gravitation universelle ;
• r : distance par rapport au centre de la planète (encore appelée "coordonnée radiale").

De sorte que g = - G * M / r 2 * 1r
⇒ plus un corps est éloigné du centre de la planète, plus son poids diminue. Cette décroissance est en 1/r2 (NB : comme le champs électrique d'une charge ponctuelle ...).

À une distance proche de la surface terrestre on peut considérer que g est une constante de valeur de g = G * M / R 2 ≈ 9,81 m/s2 (où R=6.370km est le rayon de la Terre), car une altitude de 1.000m par rapport à la surface terrestre (par exemple) ne représente que 1/6.370≈0,2% de Rg = G * M / ( R + 1.000) 2 ≈ 9.81 m/s2.

On arrondit souvent g à 10 m/s2.

Notons que cette hypothèse de g constant était sous-jacente dans la section précédente. Nous allons maintenant lever cette hypothèse (ce qui revient à se situer à de hautes distances de la surface de la Terre) et voir ce qu'il en devient du potentiel gravitationnel VG = Ep / m = g * z n_potentiel-gravitation lorsque le champs est variable.

Si g est variable alors F = m * g l'est aussi ⇒ W = F * L aussi. Pour calculer W on va donc devoir utiliser le calcul intégral, c-à-d additionner des dW, en posant que g est constant non plus ∀ r mais seulement ∀ dr, c-à-d ∀ Δr de taille arbitrairement petite et donc potentiellement infiniment petite.

gravitation-universelle.png

Ainsi calculons le travail nécessaire pour déplacer la masse m entre l'altitude r (par rapport au centre de la Terre) et l'infini. L'infini est une situation théorique qui permet ici de définir un référentiel d'énergie potentielle nulle : si r = ∞n_force-gravitation-universelle f = - m * G * M / r 2 * 1 = 0 ⇒ n_travail W = F * x(t) = 0 ⇒ n_energie-potentielle Ep = W = 0 : l'infini équivaut au vide intersidéral, de sorte que la masse en question n'y a plus d'interaction avec la Terre.

Rappel : dans la section précédente nous avons vu que la hauteur à laquelle on place le zéro de l'échelle du potentiel n'a aucune importance ⇒ on peut le placer où l'on veut, notamment à l'infini.

W = ∫r dW    ⇔ par n_energie-potentielle :
W = ∫r m * g * dr'    ⇔
NB : notez la distinction à faire entre la variable de position r' et le r de l'intégrale qui est la valeur de départ.
W = ∫r m * G * M / r' 2 * dr'    ⇔
W = m * G * M * ∫r 1 / r' 2 * dr'    ⇔ par n_integrale :
W = m * G * M * [ - 1 / r' ]r    ⇔
W = m * G * M * / r    ⇔
L'interprétation est intuitive : plus r est élevé, c-à-d plus on part de haut (zi ⇔ VGi ), moins grand est le travail à réaliser pour élever la masse jusqu'à l'infini (zf = ∞ ⇔ VGf = 0).

À l'infini on a donc que :
Ep(∞) = 0
et d'autre part le travail à fournir pour élever jusqu'à l'infini une masse m à partir d'une hauteur r (comptée à partir du centre de la Terre) vaut :
W = m * G * M * / r
or par n_energie-potentielle :
Ep(r) = Ep(∞) - W    ⇒
Ep(r) = - m * G * M * / r    ⇒
VG(r) = Ep(r) / m = - m * G * M * / r / m    ⇔
VG = Ep / m = - G * M * / r

gravitation-universelle-2.png

Le graphe ci-joint est celui de la fonction VG(r). Il illustre la notion de "puis de potentiel" : pour envoyer une masse m à l'infini à partir de la surface de la Terre il faut une énergie égale à m * G * M * / r, où G * M * / r est la profondeur du puis de potentiel, ou encore la différence de potentiel libératrice. L'énergie qu'il faut mobiliser pour libérer une masse (en l'occurrence une fusée) de la gravitation terrestre est considérable. Ainsi la vitesse de libération du champs gravitationnel terrestre est la solution de l'égalité entre l'énergie cinétique et Ep(r) :
1/2 * m * v2 = m * G * M * / R    ⇔
v = √(2 * G * M * / R)    ⇔
v = √(2 * G * M * / R2 * R )    ⇔ par n_acceleration-gravitation
v = √(2 * g * R )
Cette vitesse, indépendante de la masse de la fusée, vaut :
√(2 * 0,01 * 6.370 ) ≈ 11,3 km/s

gravitation-universelle-3.png

Le graphique suivant représente la baisse (en 1/r) du potentiel gravitationnel au fur et à mesure que l'altitude (la distance au centre de la Terre) augmente : chaque anneau représente un multiple du rayon terrestre. Il y a isotropie des équipotentiels puisque ce sont des sphères centrées sur le centre de la planète.

Potentiel électrique
https://jortay.net/savoir-de-base#potentiel-electrique

On va s'intéresser aux potentiels associés à des champs électriques uniformes. Pour ce faire on va se mettre dans une situation comparable au champs gravitationnel, au moyen d'une plaque d'une certaine surface, située dans le vide (⇒ elle ne subit pas de gravitation), chargée négativement (par exemple en la frottant). La méthode de Gauss nous a montré que cette plaque génère un champs perpendiculaire à sa surface et sur une zone centrée (cf. #methode-gauss-plan). La plaque étant chargée négativement, nous savons par n_champs-electrique que le champs est alors dirigé vers la plaque (des deux côtés de celle-ci (mais seul nous intéresse ici le côté "supérieur", pour l'analogie avec le champs gravitationnel). Si nous plaçons une charge q dans ce champs E, nous savons qu'elle va y subir une force F = q * E n_champs-electrique.

potentiel-electrique-intro.png

Considérons maintenant le cas de deux billes dont l'une est chargée positivement (bille verte), tandis que la charge de l'autre est neutre (bille bleue). Vu qu'on se situe dans le vide interstellaire les deux billes sont en apesanteur. Cependant la bille verte, étant chargée négativement, est naturellement collée contre la paroi (qui est négative). Pour éloigner la bille de la plaque (on ne dit pas lever car en apesanteur il n'y ni haut ni bas) d'une distance z, il faut combattre la force d'attraction F en effectuant un certain travail W = F * z = q * E * z n_travail, de sorte qu'à la distance z la bille a acquis une énergie potentielle EP = W. Si de la distance z on relâche la bille, celle-ci retourne vers la plaque en acquérant une vitesse v (avec accélération constante) lui donnant ainsi une énergie cinétique EC = 1/2 * m * v2 telle que EC = EP.

NB : ne pas confondre EP (énergie potentielle) et E (module du champs électrique).

L'équation permettant de calculer le potentiel électrique V correspondant à une distance quelconque z, peut être développée comme suit :
EP / q =
W / q =
F * z / q
q * E * z / q =
E * z    ⇔
V(z) ≡ EP(z) / q = E * z [J/C]
dont la forme en différences est :
ΔV ≡ ΔEP / q = E * (zf - zi)
zf et zi sont les positions initiales et finales d'une trajectoire entre deux niveaux de potentiel.

Unité. [J/C] est appelé volt [V]. Cette notion de volt est cependant moins intuitive : il faut bien se rappeler que les volts ce sont des joules par coulomb, puisque la notion de potentiel sert précisément à décrire ce qu'il se passe au niveau énergétique (cf. les Joules) quand on déplace des charges dans un champs électrique !

potentiel-electrique.png

Le terme volt vient du nom de l'inventeur de la pile électrique, Alessandro Volta. Comme son nom l'indique une pile électrique est une pile de disques, alternativement composés de zinc et d'argent : celui du bas était en zinc et celui du haut en argent. Ces disques étaient séparés par un buvard imbibé d'acide. Enfin les deux plaques extrêmes comportent une patte appelée "électrode". Celle en zinc (en bas) arrachant les électrons de l'argent (qui a des électrons périphériques mobiles passant facilement au zinc) est alors chargée négativement, tandis que l'électrode du haut (en argent) est chargée positivement.

Ce différentiel de charge génère un champs électrique E. Mais c'est le potentiel V = EP / q = E * d qui caractérise la pile, via la distance d entre les deux électrodes.

Le travail nécessaire pour déplacer une charge positive de l'électrode négative vers la positive est tel que :
W = F * d    ⇔
W = q * E * d    ⇒ par n_potentiel-electrique :
W = q * V

Ainsi la connaissance du potentiel électrique V permet ainsi de faire facilement des bilans énergétiques pour des échanges de charges entre les deux électrodes. Ainsi en connaissant q et V (déterminés lors de la fabrication de la pile) on connaît alors l'énergie cinétique provoquée par le retour, sur l'électrode négative, de la charge positive qui aura été relâchée de l'électrode positive. Ainsi soit une pile de 1,5 volt de potentiel, alors une charge de 1C échangée entre les deux électrodes met en jeu une énergie de EP = q * V = 1 * 1,5J.

N.B. Pour que le champs entre les deux électrodes soit uniforme (c-à-d pour que les équations ci-dessus soit valables) il faudrait que ces électrodes soient des plaques.

L'analogie avec le potentiel gravitationnel s'applique également pour la notion de différence de potentiel : ΔEP = q * ΔV
de sorte que l'énergie potentielle et le potentiel peuvent être aussi définis à une constante près. Autrement dit, il ne doit pas nécessairement avoir correspondance entre le zéro de l'échelle de distance et celui de l'échelle de potentiels. Le potentiel est donc une notion abstraite puisqu'à un même point de l'espace la valeur du potentiel sera fonction de la distance arbitraire à laquelle sera fixé le potentiel zéro !

potentiel-electrique-2.png

Soit une pile de 1V de potentiel. Gauche : si le zéro est sur la borne négative, alors la borne positive est à +1V. Droite : si le zéro est placé sur la borne positive alors la borne négative est à -1V. On pourrait aussi avoir -1/2 sur la borne négative et 1/2 sur la borne positive, etc. Tous ces différents "calages" sont équivalents : Vf - Vi = 1 - 0 = 0 - (-1) = 1/2 - (-1/2) = 1 où les indices f et i sont relatifs à la force qu'il faut appliquer pour remonter le courant de la force "naturelle" du système considéré (ici la pile).

Une pile fournit donc une différence de potentiel, encore appelée "tension électrique", "force électromotrice", ou encore "voltage".

potentiel-electrique-3.png

En résumé, la plaque (ci-contre en bleu clair) chargée négativement génère dans son environnement :

  • E : un champs de forces électriques F = q * E (uniformes) , de nature vectorielle (répartition spatiale de vecteurs, dont l'unité des modules est le N/C), qui modélise les forces exercées sur les charges ;
  • V : un champs de potentiels électriques V(x) , de nature scalaire (répartition spatiale de nombres dont l'unité est le volt=J/C), qui informe sur la situation énergétique (bilans énergétiques).
potentiel-electrique-4.png

Illustration

Supposons que dans le champs de potentiels du graphique précédent, le module du champs de force uniforme est fixé à E = F / q = 2 N/C. Notons que cela détermine l'échelle des distances (valeur de V à x=1) : par n_potentiel-electrique :
V = E * x    ⇒
(NB : ceci illustre bien pourquoi il ne faut jamais oublier que l'unité du potentiel, le volt, c'est des joules par coulomb).
V = 2 * x    ⇒
la valeur de V pour laquelle x=1 est :
V = 2 * 1 = 2

La fonction potentiel V(x) = E * x n_potentiel-electrique est donc une fonction du champs électrique, dont le module E exprime la sensibilité (pente) du potentiel par rapport à la distance. Et la connaissance du potentiel permet de connaître l'énergie des charges se trouvant dans ce potentiel. Par V(x) ≡ EP(x) / q = E * x n_potentiel-electrique :
1 : champs de forces : V(x) = E * x
2 : champs de potentiels : EP(x) = q * V(x)
la connaissance du champs E permet de calculer le potentiel V, qui permet de calculer l'énergie EP.

Le graphe infra représente ces deux fonctions (NB : les unités ne sont pas les mêmes : le potentiel est en volts, tandis que l'énergie est en joules). La droite du potentiel correspond au champs de 2N/C, et la droite de l'énergie potentielle concerne une charge de 0,5C (NB : charge positive).

potentiel-electrique-5.png

Procédons au bilan énergétique de cette charge positive lorsqu'elle se situe à une distance x=1 de la plaque. Pour ce faire nous avons à notre disposition deux outils : le champs et le potentiel :

  • champs : cette charge subit une force attractive (puisque la plaque est quant à elle chargée négativement) :
    F = q * E    ⇒
    F = 0,5 * 2 = 1N
    Analyse : si cette charge n'est pas retenue alors elle se dirige naturellement vers la plaque ⇒ sa position naturelle est donc en x=0 ⇒ la force d'application (qui s'oppose à la force naturelle du système) est telle que xi=0.
  • potentiel : sa valeur est :
    V(x) = E * x    ⇒
    V(1) = 2 * 1 = 2V    ⇒
    ce qui pour une charge de 0,5C correspond à une énergie de :
    EP(x) = q * V(x)   ⇒
    EP(1) = 0,5 * 2 = 1J
    Analyse : tant que la charge est immobile (retenue) en x=1 il y a égalité entre son énergie potentielle et son énergie totale.

Dans le graphe supra l'énergie totale est représentée par une horizontale (en mauve), ce qui exprime le principe de conservation de l'énergie. La diagonale hachurée exprime alors la transformation de l'énergie potentielle en énergie cinétique au fur et à mesure que la charge se rapproche de la plaque, à vitesse croissante. Cette vitesse est causée par la force d'attraction, et est à son tour la cause de l'augmentation (linéaire) de l'énergie cinétique : F ⇒ v ⇒ Ec.

Par analogie avec la gravitation on peut interpréter la droite du potentiel comme le flanc d'une pente où dévalent des billes (les charges positives) : une charge positive descend le potentiel, tout comme elle est tirée par le champs dans la direction de diminution du potentiel.

Charge
négative

Mais cette analogie avec la gravitation n'est plus valable dans le cas de charges négatives ! Si la charge passe de +0,5C à -0,5C, alors la force devient répulsive (puisque la plaque est chargée négativement) :

  • champs : cette charge subit une force répulsive (puisque la plaque est quant à elle chargée négativement) :
    F = q * E    ⇒
    F = -0,5 * -2 = 1N
    : puisque E≡F/q le signe de q détermine celui de E.
    Analyse : si cette charge n'est pas retenue alors elle s'éloigne de la plaque ⇒ elle ne se situe donc pas naturellement en x=0 ⇒ la force d'application (qui s'oppose à la force naturelle du système) est telle que xf = 0
  • potentiel : sa valeur est :
    V(x) = E * x    ⇒
    V(1) = 2 * 1 = 2V    ⇒
    ce qui pour une charge de -0,5C correspond à une énergie de :
    EP(x) = q * V(x)   ⇒
    EP(1) = -0,5 * 2 = -1J
    Analyse : la notion d'énergie négative est peu intuitive, mais n'oublions pas que le niveau où est placé le zéro de l'énergie négative est arbitraire : ce qui compte ce sont les différentiels !

    Plus intuitivement [développement de la double égalité n_potentiel-electrique] : soit la charge négative en x=1 ⇒ pour la pousser en x=0 il faut exercer un travail de :
    W = F * x    ⇔
    W = 1 * 1 = 1J   ⇔
    EPf - EPi = 1J    ⇔
    EP(0) - EP(1) = 1J    ⇒
    si calage | EP(0) = 0    ⇒
    0 - EP(1) = 1J    ⇔
    EP(1) = -1J    ⇔
    Et si alors en x=0 on relâche la charge on constate que l'énergie potentielle diminue, au profit de l'énergie cinétique, qui augmente sous l'effet de la force de répulsion, et par l'intermédiaire de la vitesse croissante : on a toujours F ⇒ v ⇒ Ec. La charge négative remonte donc le potentiel : en s'éloignant de la plaque elle passe par des valeurs croissantes du potentiel.

potentiel-electrique-6.png

Par analogie avec la gravitation on peut voir les particules négatives comme de petites bulles d'air dans l'eau, et qui, poussées vers la droite par la force répulsive, remonteraient le long d'une paroi inclinée (la ligne continue du graphe) située juste au-dessus d'elles.

On a donc une règle générale : toute charge (quel que soit son signe) se dirige (mouvement) dans le sens de la diminution de son énergie potentielle, et donc dans le sens de l'augmentation de son énergie cinétique (mouvement). La différence c'est que les charges négatives remontent le potentiel (c-à-d vont donc contre /sont repoussées par le champs), tandis que les charges positives descendent le potentiel (c-à-d suivent /sont tirées par le champs). La direction du champs indique donc toujours la baisse du potentiel. Nous verrons supra que cette règle générale vaut également dans le cas d'une plaque positive.

potentiel-electrique-7.png

Cette propriété de la charge négative remontant le potentiel correspond précisément à ce qui se passe dans les circuits, par exemple celui constitué par une pile dont on a relié les deux électrodes par un fil de cuivre (qui conduit l'électricité): un courant transporte les électrons de l'électrode négatives, qui remontent ainsi jusqu'à l'électrode positive. Les électrons "remontent" naturellement le champs électrique, du fond de leur puis de potentiel !

Ici il n'y a donc plus analogie avec le champs gravitationnel, qui maintient la masse au fond du puis, tandis que les électrons le remontent naturellement (si les électrodes sont reliées par un conducteur). Nous avons vu que cela est du au fait qu'on peut donner un signe différent aux charges, tandis que la masse est toujours positive.

Mais en remontant le potentiel les électrons de la pile perdent de leur l'énergie potentielle. Pourtant leur vitesse est constante, ce qui implique qu'ils ne gagnent pas d'énergie cinétique. Comment cela est-il possible, puisqu'il y a conservation de l'énergie ? La réponse est qu'il y a bien conservation, mais que la transformation peut se faire vers diverses forme d'énergies alternatives. En l'occurrence l'énergie potentielle ne se transforme pas en énergie cinétique mais en énergie thermique c-à-d en chaleur. C'est l'effet Joule : une résistance liée à une source de tension produit de la chaleur.

Plaque +
Charge +

Passons maintenant au cas d'une plaque positive. Dans ce cas le champs est extraverti n_champs-electrique. Considérons le cas d'une charge d'essai positive q=0,5C, toujours dans un champs tel que E = F / q = 2 N/C.

  • champs : cette charge négative subit une force répulsive (puisque la plaque est aussi chargée positivement) :
    F = q * E    ⇒
    F = 0,5 * 2 = 1N
    Analyse : la charge n'est pas naturellement contre la plaque ⇒ la force d'application (qui s'oppose à la force naturelle du système) est telle que xf = 0.
  • potentiel : soit la charge située en x=1 ⇒ pour la ramener sur la plaque (c-à-d en x=0) il faut exercer un travail :
    W = F * x   ⇒
    W = 1 * 1 = 1J    ⇒
    EPf - EPi = 1J    ⇔
    EP(0) - EP(1) = 1J    ⇔
    0 - EP(1) = 1J    ⇔
    EP(1) = -1J    ⇒
    V(1) = EP(1) / q    ⇔
    V(1) = -1 / 0,5 = -2J
    Analyse :
    • le graphe de EP est celui correspondant à plaque et charge négatives ;
    • le graphe de V est le symétrique de celui de la plaque négative ⇒ le champs de potentiels est le même que celui de la plaque négative au signe près.

La règle générale supra se complète donc par une propriété supplémentaire : lorsqu'on s'éloigne de la plaque, une plaque positive génère donc dans son espace environnant un potentiel qui diminue (dans les valeurs négatives), tandis qu'une plaque négative génère un potentiel qui augmente (dans les valeurs positives).

Plaque +
Charge -
  • champs : cette charge subit une force attractive (puisque la plaque est chargée positivement) :
    F = q * E    ⇒
    F = -0,5 * -2 = 1N
    Analyse : la charge est naturellement contre la plaque c-à-d en x=0 ⇒ la force d'application (qui s'oppose à la force naturelle du système) est telle que xi = 0.
  • potentiel : puisque l'on connaît le potentiel de la plaque en x=1, on peut aller plus vite pour ce second point : EP = q * V    ⇒
    EP(1) = -0,5 * V(1)    ⇒
    EP(1) = -0,5 * -2 = 1J
    Et pour ceux qui souhaitent vérifier :
    W = F * x    ⇒
    W = 1 * 1 = 1J    ⇒
    EP = W    ⇒
    EPf - EPi = 1J    ⇔
    EP(1) - EP(0) = 1J    ⇔
    EP(1) - 0 = 1J    ⇔
    EP(1) = 1J    ⇒
    V(1) = EP(1) / q    ⇔
    V(1) = 1 / -0,5 = -2J

    Analyse :
    • le graphe de EP est celui correspondant à plaque négative et charge positive ;
    • le graphe de V est celui de la plaque négative ⇒ le champs de potentiels est le même que celui de la plaque négative au signe près.
potentiel-electrique-8.png

Le signe + de V+(x) signifie qu'il s'agit du potentiel de la plaque positive.

Le graphique suivant résume les quatre cas de figure.

potentiel-electrique-synthese.png
Accélérateur
de particules

Pour construire (et améliorer) des accélérateurs de particules chargées – utilisés dans certains appareils médicaux, ou encore pour la recherche fondamentale sur la composition de la matière – il est indispensable de connaître la théorie que nous venons de présenter.

potentiel-electrique-9.png

Voici comment fonctionne un accélérateur (linéaire). Une source de particules (cube en bleu dans le graphique ci-joint) contient des atomes d'hydrogènes qui sont ionisés (débarrassés de leur unique électron) ⇒ il ne reste de chaque atome H que son unique proton. Ces protons sortent de la source à très basse vitesse (v≈0) puis traversent des cylindres de cuivre (qui est conducteur, en jaune dans le graphique). Ceux-ci sont reliés par une source de tension : une différence de potentiel (atteignant des milliers de volts) est créée de sorte que le premier cylindre est chargé positivement et le second négativement (et nous avons vu que le sens du courant va de borne positive à borne négative : #algebre-electricite). Chaque cylindre fonctionnant comme un plan (cf. supra #methode-gauss-plan), un champs électrique uniforme est ainsi créé entre eux. Ce champs entre les cylindres accélère ainsi les protons qui le traversent.

Application . Comment calculer la vitesse acquise par les protons accélérés ?

Du point de vue de l'ingénieur qui conçoit l'accélérateur, pour dimensionner celui-ci il faut connaître la vitesse en fonction de la tension que l'on va appliquer.

Un façon de résoudre ce problème est de calculer l'accélération : un proton a une certaine masse, or toute masse qui subit une force est accélérée ⇒ on peut donc utiliser les équations du MRUA (cf. supra #cinematique). Cependant une solution plus simple (requérant moins de calculs) consiste à utiliser le principe de conservation de l'énergie, et donc en l'occurrence d'utiliser la notion de potentiel électrique. Nous avons vu qu'à la distance entre ces deux cylindres correspond une différence de potentiel, que l'on peut calculer par V = E * d n_potentiel-electrique.

potentiel-electrique-10.png

Supposons un proton situé contre le second cylindre, et que l'on ramène au premier. Pour contrer le champs il faut exercer un travail, qui confère au proton une énergie potentielle : EP = q * V    n_potentiel-electrique. Ensuite si on relâche le proton, alors il repart vers le second cylindre, avec augmentation de son énergie cinétique, qui est égale à l'énergie potentielle :
EC = EP     ⇔
1/2 * m * v2 = q * V     ⇔
v = √( q * V * 2 / m)
où :
• la charge q du proton, est la même que celle de l'électron au signe près (cf. supra #atomes) ;
• la masse m du proton est donnée via le nombre d'Avogadro Nu*mu ;
• on fixe V=50.000V ;
⇒ v = 3 * 106 m/s
c-à-d 3.000 km/s, ou encore 1% de la vitesse de la lumière : à cette vitesse les protons mettraient environ deux secondes pour atteindre la lune !

potentiel-electrique-synthese-2.png

On notera que l'énergie potentielle ne diminue pas entre les deux cylindres (N.d.A. Le graphique ci-joint en montre l'explication : le système de l'accélérateur est une superposition de deux des quatre cas étudiés ci-avant : plaque(+) & charge(+) + plaque(-) & charge(+). Or, par symétrie, les deux effets se neutralisent, l'un correspond à une augmentation d'énergie potentielle tandis que l'autre correspond à une diminution de même ampleur).

Ainsi en ajoutant des étages d'accélération (c-à-d des couples de cylindres) on peut atteindre des vitesses proches de celle de la lumière. On atteint ainsi des niveaux d'énergie cinétique considérables qui permettent, en faisant se collisionner des protons, d'étudier leurs débris et partant la composition des particules collisionnées. Les accélérateurs sont utilisés aussi pour l'imagerie médicale (dans ce cas les particules accélérées sont des électrons, générant ainsi des rayons-x) ou encore la protonthérapie (des protons sont accélérés par un accélérateur circulaire appelé "cyclotron").

Loi d'Ohm
https://jortay.net/savoir-de-base#ohm
ohm-electroscope.png

Dans les années 1820, des scientifiques ont relié au pôle positif d'une pile volta un électroscope à feuillets d'or. On constatait alors que les feuillets s'écartaient. Cet écartement mesure la tension de la pile.

Cependant à cette époque on n'en comprenait pas la raison, à savoir que les électrons de ces feuillets rejoignant la pile, les feuillets portaient alors des charges de même signe (en l'occurrence positif), et par conséquent se repoussaient.

ohm-boussole.png

Quelques années plus tard Ampère découvrit qu'en reliant les électrodes de la pile par un fil métallique on constatait que l'aiguille d'une boussole placée à proximité du fil était déviée, ce qui pourrait constituer une mesure du courant passant par le fil. Mais il constata aussi que l'effet de tension observée sur les deux feuillets de l'électroscope disparaissait, ce qui rendait impossible la mesure d'une relation entre l'écart des feuillets et la variation de l'aiguille.

Ohm reproduisit alors cette expérience sous diverses formes, et découvrit que dans le système originel la tension disparaissait en raison d'un défaut de la pile volta : elle est composée d'une résistance interne très importante. Il conçut alors une source de tension avec une faible résistance : un thermocouple. La tension est plus faible mais le système présente l'avantage que la tension ne disparaît pas, ce qui permit à Ohm de mesurer la relation entre celle-ci et le courant généré (mesuré par la déviation de la boussole, et d'ainsi confirmer expérimentalement sa théorie mathématique.

ohm-pile.png

Celle-ci, la loi d'Ohm, décrit une relation de proportionnalité entre la tension (le voltage) V appliquée à un conducteur, et le courant I résultant de cette tension. Le coefficient de proportionnalité R est appelé "résistance électrique" : V = R * I.

Notons qu'à cette époque Ohm et les autres savants ignoraient que le courant mesuré par l'aiguille de la boussole correspondait à un flux de charges, et que la tension mesurée par l'écartement des feuillets correspondait à une différence de potentiel électrique, elle même liée à l'énergie potentielle des charges responsables du courant.

Pour illustrer le développement mathématique de la loi d'Ohm au regard des connaissances actuelles sur les électrons, reprenons le cas de l'accélérateur de particules présenté dans la section précédente. La particule y est accélérée sous l'action d'une force continue. Maintenant si l'on place des obstacles sur la trajectoire de la charge qe, sa trajectoire ne sera plus rectiligne, de sorte que sa vitesse n'est plus accélérée. Cette situation est celle d'une barre métallique, dont on sait que ses atomes sont agencés en réseau cristallin. Dans cette situation qui est celle d'un matériaux conducteurs, les atomes perdent un électron périphérique, qui devient libre, et n'est mobile que par l'agitation thermique. Mais si en outre ces électrons libres sont soumis à un champs électrique, alors ils vont en suivre le courant.

C'est une propriété des matériaux conducteurs que d'être composés notamment d'un grand nombre d'électrons libres (à l'opposé, les isolants n'en contiennent que très peu).

Nous allons maintenant faire une hypothèse pour simplifier le développement mathématique de la loi d'Ohm : l'électron considéré dans l'accélérateur possède une charge ... positive (rappelons-nous que l'attribution de la charge négative aux électrons est une convention et non un fait physique : cf. #algebre-electricite). Concrètement, on pose ainsi que le mouvement des électrons vers la gauche c'est comme des charges positives qui vont vers la droite.

On va modéliser (i) une vitesse constante, qui est la moyenne des vitesses de l'ensemble des électrons de charge +, et (ii) un débit de charges.

On peut faire à nouveau l'analogie avec la force de gravitation, où une bille de plomb lâchée dans un tube d'huile, subit une force de friction fluide, ayant pour effet que son accélération est annulée, de sorte que la vitesse est constante. Une bille d'or de même dimension descendrait deux fois plus vite qu'une bille de plomb car sa densité est deux fois plus élevée. La vitesse est donc proportionnelle à la force subie : v ∝ m * g.

Pour approfondir ce point voir infra : #chute-des-corps

Ainsi, pour revenir au cas de nos électrons dans cette analogie :
v ∝ qe * E    ⇒
puisque qe est une constante naturelle :
v ∝ E    ⇒
v = μ E
μ est la mobilité électronique des électrons libres du matériaux considéré.

D'autre par le débit de charge (le courant) se mesure par :
I = qe * η * Volume / Δt
η est la densité des électrons libres par unité de volume du matériaux considéré (qui est égal à la densité des atomes par unité de volume) ⇔
I = qe * η * ( v * Δt * S ) / Δt
S est la surface de section de la barre de matériaux    ⇔
I = qe * η * v * S    ⇔ par n_mobilite-electronique :
I = qe * η * μ E * S
or : V = E * L   n_potentiel-electrique   ⇔ E = V / L   ⇒
I = qe * η * μ * S / L * V    ⇔
I = σ * S / L * V
où :
σ = qe * η * μ
sont trois propriétés physiques propres au matériaux, déterminant sa conductivité électrique (σ) ;
• alors que S / L sont des propriétés géométriques propres à la barre constituée du matériaux ;

V = 1 / σ * L / S * I    ⇔
V = R * I
R = 1 / σ * L / S est la résistance du matériaux utilisé.
CQFD

  • On notera la cohérence intuitive de la relation physique de R avec la conductivité σ, la surface S de la section ("plus le tuyau est large plus ça passe"), et la longueur (plus la barre est longue dans l'espace, plus sa résistance est longue dans le temps). Démonstration plus rigoureuse concernant L : par E = V / L n_potentiel-electrique ⇒ pour un potentiel conservé, si L diminue alors c'est nécessairement que le champs, c-à-d la pente du potentiel, augmente. Ainsi L, qui apparaît comme un paramètre géométrique, est plutôt de nature dynamique.
  • Ohm avait compris que R = ? * L / S. Ce n'est que plus tard, grâce à la compréhension des composants microscopiques de l'électricité (les électrons), que l'on a pu établir que ?=1/σ.

Une lecture peut être plus intuitive de la loi d'Ohm est I = V / R :
• il ne peut y avoir de courant sans différence de potentiel ;
• le courant est d'autant plus élevé que la résistance est faible.

Ce qui est moins intuitif c'est que dans le vide (on retire la barre) la résistance n'est pas nulle mais ... infinie ! En effet si ∄ barre ⇒ ∄ électrons libres ⇔ η=0 ⇒ par n_conductivite : σ=0 ⇒ par n_loi-ohm : R=∞.

Revenons à la forme classique de la loi d'Ohm V = R * I , qui est celle la plus utilisée dans la pratique : la connaissance du courant I et de la résistance R du matériaux imposent une tension électrique V=R*I aux bornes du conducteur. Cette forme induit deux propriétés différentes de la relation entre la tension et la longueur de la barre (rappel : R = 1 / σ * L / S) :

  • plus la barre est longue, plus le potentiel doit être élevé pour fournir un courant déterminé ;
  • le potentiel (la tension) diminue progressivement le long du conducteur (cf. supra l'image des charges descendant le long du potentiel) : plus l'électron est situé vers la droite, plus la distance qui le sépare de la borne négative est petite.
ohm-avancee.png

On comprend alors que dans la double égalité V(z) ≡ EP(z) / q = E * z n_potentiel-electrique on peut voir dans la chronologie des découvertes :

  1. V(z) = E * z : le champs électrique E est la pente du potentiel V(z) ;
  2. V(z) ≡ EP(z) / q : c'est la diminution du potentiel qui est responsable du courant ⇒ I = V / R.

Dans l'analogie avec la gravitation la particule est vue comme une masse descendant le long d'un plan. En l'absence de frottement la masse va accélérer. Mais en présence de frottements (cf. les obstacles que sont les atomes de la barre) la mobilité sera réduite.

Notons enfin qu'Ohm fut très influencé par la loi de Fourrier sur la conduction de la chaleur ΔT = R * H
ΔT est le différentiel de température entre deux "sources de température" (tout comme V est la différence de potentiel) ;
H est le débit de chaleur entre ces deux sources, au travers d'un matériaux ;
R est la résistance thermique de ce matériaux.
Ainsi par des développement mathématiques Fourrier avait également démontré théoriquement une relation linéaire entre ΔT et L.

ohm-circuits.png

Ohm a ainsi donc modélisé le premier circuit électrique, ouvrant ainsi la voie de l'électronique ...

Champs quelconque
https://jortay.net/savoir-de-base#champs-non-uniforme

Nous avons jusqu'ici supposé le cas de champs uniformes, c-à-d notamment que les vecteurs du champs ont même direction et module. Il en résulte que les trajectoires des électrons dans ce champs sont également uniformes, ce qui facilite grandement leur calcul. Mais lorsque le champs est quelconque, les trajectoires des électrons sont généralement non rectilignes. Une technique de calcul de ces trajectoires est l'intégrale de circulation.

Trajectoire

Pour développer tout cela il nous faut commencer par montrer qu'une différence de potentiel est indépendante de la trajectoire suivie par un corps pour passer d'un niveau de potentiel à l'autre.

Nous allons donc montrer qu'il y a là une analogie directe avec le champs gravitationnel : dans la section #potentiel-gravitationnel nous avions en effet montré que le travail à fournir pour élever une masse m à une hauteur h est indépendant de l'angle que fait avec le sol la pente par laquelle la masse est élevée, c-à-d indépendant de la longueur du chemin choisi.

champs-quelconque.jpg

Le graphique ci-contre illustre la trajectoire quelconque d'un corps entre les positions initiale (i) et finale (f), auxquelles correspondent une différence de potentiel ΔV. Au corpuscule sont associés un vecteur déplacement dl et le champs E.

Commençons par le cas d'un champs uniforme tel que E = 1 N/C et ΔV = 1 J/C ⇒ par n_potentiel-electrique dl = 1. Si l'on déplace alors la charge d'un niveau de potentiel x à x+1 selon un trajectoire qui n'est plus parallèle au champ ⇒ dl augmente. On se rend alors compte qu'il faut adapter ΔV = E * Δl n_potentiel-electrique pour que la modélisation mathématique soit cohérente avec le fait que le champs de potentiels est une "lasagne" indépendante de la trajectoire prise pour passer d'un niveau de potentiel à l'autre. En fait ΔV = E * Δl= F / q * Δl = W / q n'est qu'un cas particulier tel que le vecteur "force" F et le vecteur "déplacement" Δl sont parallèles. Or on sait que la formulation générale du travail, c-à-d pour une forcée exercée dans une direction quelconque par rapport à celle du déplacement, est donnée par le produit scalaire (cf. supra #vecteur-produit-scalaire)

champs-quelconque-gravitation.jpg

Pour montrer cela dans une autre expérience, plaçons-nous à nouveau d'abord dans le contexte gravitationnel. Un homme placé sur un plateau roulant dans un MRU (cf. supra #cinematique) soulève une masse. La trajectoire de celle-ci ne sera donc plus perpendiculaire au sol. Or le travail effectué par l'homme est inchangé par rapport à la situation de repos : son mouvement implique certes une énergie cinétique, mais celle-ci étant constante durant l'exercice (puisqu'on est en MRU), le bilan énergétique (notion de différentiel) est identique à la situation sans mouvement. C'est donc la projection verticale du déplacement (c-à-d sur la direction de la force gravitationnelle) qu'il faut prendre en compte dans le calcul du travail. Nous avons vu dans #vecteur-produit-scalaire que c'est précisément ce que fait le produit scalaire : pour calculer le travail fourni par l'homme, la force appliquée par celui-ci, Fa = - m * g, doit être multipliée non pas par Δl mais par Δl * cos(θ) :
W = m * g * Δl * cos(θ)    ⇔
W = Fa * Δl    ⇔
W = - m * g * Δl    ⇒
N.B. L'apparition du signe -, liée au remplacement de g par g, et qui exprime que le travail est calculé à partir de la force appliquée (orientée vers le haut) et non du poids c-à-d la force gravitationnelle (orientée vers le bas). Ce signe - n'implique pas que le travail est négatif : Fa est appliquée vers le haut, ce qui implique que θ<π/2 ⇒ cos(θ)>0 ⇒ W est bien positif par la première des trois égalités ci-dessus ! ΔVG = - g * Δl
Ainsi la différence de potentielle est bien toujours positive, dans le sens opposé à celui du champs.

champs-quelconque-electricite.jpg

Champs
équipotentiel

Rien n'empêche d'appliquer au champs électrique les principes développés ci-dessus :
m devient q
g devient E

W = - m * g * Δl
devient
W = - q * E * Δl    ⇒
ΔV = - E * Δl
que l'on comparera utilement à :
ΔV = E * (zf - zi) n_potentiel-electrique
en comprenant la signification du signe - lorsque l'on passe de la norme E au vecteur -E.

champs-quelconque-projections.jpg

Or, par définition du produit scalaire, dans n_champs-equipotentiel, Δl représente des vecteurs qui ont tous la même projection Δz sur E :
ΔV = E * Δz
N.B. il s'agit ici non plus de vecteurs mais de scalaires, d'où la disparition du signe -.

champs-quelconque-equipotentiel.jpg

On a ainsi démontré la cohérence de la notion de champs équipotentiel : quelle que soit l'inclinaison, c-à-d la direction suivie pour passer d'un potentiel au suivant, la différence de potentiel est identique !

champs-quelconque-trajectoire.jpg

Et comme chacune de ces trajectoires rectilignes peut être vue comme la somme d'une multitudes de trajectoires également rectilignes mais non parallèles, il en résulte que le principe demeure dans le cas de trajectoires quelconques c-à-d non rectilignes :
n=1N ΔVn = - ∑n=1N E * Δln    ⇔
ΔV = - E * ∑n=1N Δln    ⇔
ΔV = - E * Δl    ⇔
⇔ on retrouve n_champs-equipotentiel.

Pour généraliser au cas de courbes quelconques lisses il suffit, dans n_champs-quelconque-trajectoire-1 de remplacer les Δln   par des dl arbitrairement petits, puis de les intégrer (sommation "continue", c-à-d comportant un nombre infini de termes) :
∫ dV = - ∫ E * dl    ⇔

  • La disparition des indices de n_champs-quelconque-trajectoire-1 se justifie par la nature indénombrable des termes d'une somme continue.
  • Le membre de droite est appelé "intégrale curviligne" (car elle intègre des distances infinitésimales), et plus précisément "intégrale de circulation" (du champs E) en raison du produit scalaire entre le champs et les distances infinitésimales.

∫ dV = - E * ∫ dl    ⇔
et par addition vectorielle (cf. #vecteur-norme-addition) :
ΔV = - E * Δl
⇔ on retrouve à nouveau n_champs-equipotentiel.

trajectoire-quelconque-champs-uniforme.jpg

Champs
quelconque

Nous venons de montrer que le principe de champs de potentiel uniforme (plus exactement "champs équipotentiel") est indépendant du chemin suivi entre niveaux de potentiel.

Mais nous avons raisonné dans le cadre d'un champs électrique uniforme. Cette hypothèse de champs constant a permis le passage de n_champs-quelconque-integration-1 à n_champs-quelconque-integration-2 en isolant le champs E hors de l'intégrale de circulation. Mais si on lève l'hypothèse de champs uniforme (c-à-d constant), cela ne sera plus possible ...

trajectoire-champs-quelconques-2.jpg

Ainsi si le champs n'est plus uniforme, alors
n=1N ΔVn = - ∑n=1N E * Δln      n_champs-quelconque-trajectoire-1
devient :
n=1N ΔVn = - ∑n=1N En * Δln

Le graphique ci-contre illustre des vecteurs de modules et directions différents, ce qui requiert de les distinguer par un indice : En ne peut donc plus être extrait de la somme.

trajectoire-champs-quelconques-2.jpg

et
∫ ΔV = - ∫ E * dl      n_champs-quelconque-integration-1
devient :
∫ ΔV = - ∫i→f E(x) * dl n_champs-quelconque-integration-3
qui indique bien que le champs varie de façon continue de position en position ⇔ on introduit le vecteur position x dans un repère cartésien ⇔ on intègre une fonction des coordonnées de l'espace (PS : on devrait également remplacer dl par dl(x) puisque les vecteurs changent de direction selon leur position, mais les mathématiciens ont pour habitude de ne pas le mentionner).

On doit alors en déduire que l'équipotentialité n'est plus localisée sous la forme de plans, mais de surfaces qui sont d'autant plus complexes que le champs électrique est complexe. Lorsque nous étudierons le calcul du potentiel d'une charge ponctuelle (notion de "champs coulombien) – qui génère un champs non uniforme – nous verrons que demeure cependant la propriété d'indifférence du différentiel de potentiel par rapport au chemin suivi entre niveaux de potentiel, c-à-d entre surfaces équipotentielles complexes.

champs-quelconque-travail.jpg

Mais avant approfondissons l'interprétation de n_champs-quelconque-integration-3 en terme d'énergie potentielle. Celle-ci est calculée par le travail réalisé pour passer du point i au point f (travail de la force "appliquée") :
dW = - q * E * dl    ⇒
W = ∫i→f dW = ∫i→f - q * E * dl    ⇒
ΔEP = ∫i→f - q * E * dl    ⇒
ΔV = - ∫i→f E * dl    ⇒
qui est bien n_champs-quelconque-integration-3. Rappelons encore une fois que le signe - exprime le fait que le travail réalisé est celui de la force appliquée contre celle du champs.

Les unités du membre de droite sont :
N / C * m = V    ⇔
N / C = V / m
qui est l'unité la plus fréquemment utilisée du champs électrique.

pile-champs.jpg

Application. Une pile est caractérisée par une différence de potentiel, c-à-d une tension, qui est créée par une réaction électrochimique accumulant des charges négatives sur un pôle et des charges négatives sur l'autre. Il en résulte un champs électrique (dit "dipolaire") sortant du pôle positif et revenant au pôle négatif. Ainsi une pile de 1,5V est telle que l'intégrale du champs - E depuis le pôle négatif jusqu'au pôle positif, selon une trajectoire quelconque vaut 1,5V. NB : on notera dans l'image ci-jointe que le champs -E remonte bien du pôle négatif (bas) vers le pôle positif (haut).

Ondes gravitationnelles

https://jortay.net/savoir-de-base#ondes-gravitationnelles

N.B. Cette section ne fait pas partie du cursus pour les examens d'entrée en école polytechnique ou faculté de médecine (les ondes gravitationnelles, théorisées au début du vingtième siècle, n'ont été observées qu'en 2016). Elle est donnée à titre informatif et ne peut être intégralement expliquée ou comprise à partir des sections précédentes.

triangle-clipedia.png Vidéo Clipedia : Les ondes gravitationnelles
ondes-gravitationnelles.gif

L'animation ci-contre illustre deux étoiles à neutrons (corps célestes dont la masse volumique est extraordinairement élevée, de l'ordre de mille milliards de tonnes par litre) qui s'étant rapprochées se sont ainsi mises en orbite autour l'une de l'autre. Ces mouvements orbitaux entraînent d'infimes ondulations, dites "ondes gravitationnelles".

La force de gravitation est la force d'attraction exercée l'une sur l'autre par deux masse M et m séparée par une distance r : FN = G * M * m / r 2

On notera la similitude de cette formule avec FC = kC * q1 * q1 / r 2 n_force-de-coulomb, décrivant la force électrique entre deux corps chargés électriquement.

Différences. La force électrique est d'un ordre de grandeur nettement plus élevé que la force gravitationnelle : FC / FN = 4,17 * 10 42 [source]. Autre différence : la force électrique peut être répulsive.

La variable d'écart r étant au dénominateur et au carré, il en résulte que ces forces diminuent exponentiellement lorsque la distance augmente.

Champs
électromagnétique

De la notion de force on passe à celle de champs gravitationnel, modélisant l'influence exercée par un corps autour de lui.

Dans la section consacrée à la forme vectoriel de la force électrique n_force-de-coulomb-vector nous avions évoqué, via la notion de vecteur radial, le fait que si l'on déplace l'un des deux corps autour de l'autre le vecteur partant du corps immobile décrit le cercle correspondant.

La propagation de cette influence d'un corps vers l'autre ne se fait pas instantanément. Il résulte de la nature spatio-temporelle de la dynamique des forces que la propagation génère une onde (électrique, gravitationnelle). Cette onde transmet un mouvement : dans l'animation suivante celui de la main est transmis à celui de la boule rouge.

onde-corde.gif

Ce sont exactement ces principes qui sont appliqués dans la communication par antennes radios dipolaires.

antenne-dipole.gif

Transmission d'ondes électromagnétiques vers une antenne dipolaire réceptrice.

L'animation suivante montre que lorsqu'un corps se déplace le champs électromagnétique qui lui est associé n'est pas déplacé en bloc mais de proche en proche.

equations-maxwell.png

Les équations de Maxwell modélisent le couplage (effet de boucle) entre champs électrique (E) et magnétique (B).

Il en résulte l'équation d'onde électromagnétique ΔE - 1 / c 2 * ∂ 2E / ∂t 2 = 0
ΔE est l'opérateur laplacien du champs E ;
c est la vitesse de la lumière, indiquant que les ondes se propagent à la vitesse de la lumière ; celle-ci n'étant pas infinie (transmission instantanée) ⇒ ΔE > 0.

Champs
gravitationnel

En réalisant un travail comparable à ceux de Maxwell sur les ondes gravitationnelles, mais appliqué cette fois aux ondes gravitationnelles, Einstein a formulé théoriquement en 1916 l'existence d'ondes gravitationnelles sous la forme d'un système d'équations plus nombreuses et complexes, dont : Gμν ≡ Rμν - 1/2 * R * gμν = 8 * π * G / c 4 * Tμν

• Gμν est le tenseur métrique du champs gravitationnel, exprimant le fait que la gravitation est une courbure de l'espace-temps ;
• T contient la masse du corps.

courbure-espace-temps.png

Le plan du graphique ci-contre représente une version simplifiée en deux dimensions de notre espace à trois dimensions, l'axe vertical représentant alors le temps (quatrième dimension). La modification de l'espace-temps par la masse de la sphère prend la forme de la courbure de l'espace représenté ici en deux dimensions ...

On notera que l'équation d'onde graviationnelle dérivée par Einstein à partir de son système d'équation est similaire à l'équation d'onde électromagnétique de Maxwell : Δhαβ - 1 / c 2 * ∂ 2 hαβ / ∂t 2 = 0

Δhαβ est le laplacien du tenseur qui est la solution de l'équation.

solution-equation-onde-gravitationnelle.png

Mais il est beaucoup plus difficile de vérifier expérimentalement l'existence des ondes gravitationnelles que celles des ondes électromagnétiques, en raison de l'ordre de grandeur nettement inférieur de la force gravitationnelle. Il faut donc être en mesure d'effectuer la mesure sur des masses d'ordres de grandeur tels que les étoiles à neutron illustrée dans l'animation au début de cette section, ou encore des trous noirs.

La vidéo suivante montre que la notion de courbure de l'espace-temps à proximité d'un corps de masse non nulle permet d'expliquer le mouvement orbital.

Relativité
générale

Le point de départ de la RG est le principe d'équivalence : la force d'inertie et la force de gravitation (le poids) sont des forces de même nature. Le cas du passager d'un véhicule spatial en MRUA – que nous avions présenté pour illustrer les principes et loi n_relativite à n_troisieme-loi-newton – est ainsi de même nature que la situation d'un individu à la surface de la Terre : l'accélération de gravitation est l'expression d'un MRUA de la Terre vers les objets que l'on voit "tomber" vers elle ou qu'elle supporte (PS : la Terre n'est donc pas un référentiel inertiel).

Cette interprétation de Terre en MRUA permanent est pour le moins contre-intuitive puisqu'elle vaut pour tous les points de planète, donc également pour deux points diamétralement opposés : comment la Terre peut-elle se déplacer en MRUA dans toutes les directions à la fois ... ? Je crois comprendre que la notion de courbure de l'espace-temps à proximité d'un corps de masse non nulle permet d'expliquer cette contradiction, mais que cela sort du champs de ce cours. Et c'est pour cela que dans les écoles est enseignée l'interprétation fausse de la "chute" des corps : car elle est plus intuitive que celle du rattrapage des corps ...

Chute
des
corps

Peu intuitive mais puissante, la relativité générale permet d'expliquer non seulement le mouvement orbital (cf. vidéo supra) mais également le fait que deux corps de masses différentes "tombent" à la même vitesse. En effet, en vertu du principe d'équivalence, en sautant ou tombant je passe dans un référentiel inertiel ⇔ je ne subis plus d'accélération ⇔ Poids = m * g n_F=m*a0 = m * 0 ⇔ je suis en apesanteur ⇔ "on ne tombe pas, on est rattrapé par la Terre" ⇒ deux corps de masse différentes sont rattrapés en même temps par la Terre. CQFD par raisonnement logique. Mais des démonstrations expérimentales ont aussi été réalisées, comme le montre la vidéo suivante.

Démonstration expérimentale (4m41s)

Optique

https://jortay.net/savoir-de-base#optique
 7.5.1. La lumière
 7.5.2. Les lentilles
 7.5.3. La vision
La lumière
https://jortay.net/savoir-de-base#lumiere
triangle-clipedia.png Vidéo Clipedia : Qu’est-ce que la lumière ?

Sans forme, sans masse, qu'est-ce donc que la lumière ? Au 19° siècle Maxwell, a développé un modèle mathématique ("équations de Maxwell" ou encore "équations de l'électrodynamique") décrivant la lumière comme une onde électromagnétique, c-à-d une oscillation du champs électrique, synchronisée avec une oscillation du champ magnétique. Les ondes électromagnétiques sont la manifestation d’une interaction à distance, mais « retardée » (c-à-d non instantanée).

Équations de Maxwell et champs électromagnétique

onde-electromagnetique.png

E : champ électrique ; B : champs magnétique.

Nous allons traiter ici uniquement du champs électrique. Celui-ci est l’expression d’une interaction à distance entre charges électriques (la force électrique).

Par définition chaque charge électrique génère un #champs-electrique. Supposons donc une charge positive, par exemple un proton (noyau de l'atome d'hydrogène). Ainsi le champs électrique exprime l'influence à distance que le proton exerce dans son espace environnant, le champs électrique s'exprimant par une force sur toute autre charge située dans le champs. Remplaçons le proton par un atome d'hydrogène c-à-d ajoutons-lui son nuage d'électron. Celui étant de charge négative son champs est orienté vers le noyau, et comme la charge du noyau vaut celle du nuage en valeur absolue, toute charge dans l'environnement de l'atome subit une force nulle. Cela est du moins le cas en situation dite d'équilibre ou de repos. Mais si l'on déstabilise l'atome, par exemple en le chauffant, de sorte que son environnement s'agite ⇒ l'atome subit des chocs ⇒ il se met à vibrer. ⇒ cette vibration est répercutée sur le champs électrique ⇒ sur les charges qui y sont situées.

Ce que Maxwell a découvert est que cette interaction dynamique n'est pas instantanée : la vibration met un certain temps à se propager (cf. le δt dans les équations de Maxwell supra) : plus la charge est éloignée du proton, plus il faut de temps pour que la vibration l'atteigne. Maxwell montre en outre que la vitesse de propagation de cette vibration, c-à-d de cette onde, est celle de la lumière, soit environ 300.000 km/s.

triangle-clipedia.png Vidéo Clipedia : La lumière est invisible

Lorsque l'onde atteint la rétine qui se trouve au fond de l'oeil elle transmet la vibration aux charges électriques constituant les atomes des cellules de la rétine. Ces cellules opèrent alors une réaction électrochimique générant un signal sur le nerf oculaire, signal conduit à la région du cerveau traitant les signaux visuels sur base desquels le cerveau va former une image, en l'occurrence un point lumineux.

Comprenons bien que la notion de propagation est liée à celle de non instantanéité : si l'interaction était instantanée il n'y aurait pas d'onde. C'est l'oscillation du champs électrique au niveau de la rétine qui va provoquer la vision. Autrement dit, même si l'interaction était instantanée on aurait le même phénomène ⇒ la notion d'onde n'est donc pas nécessaire pour expliquer le phénomène lumineux, elle n'est que l'expression du caractère non instantané de l'interaction à distance !

D'autre part cette notion d'onde doit être interprétée avec prudence : rien ne vient "frapper" la rétine ! Il ne s'agit pas d'une onde de déplacement (comme sur un corde), mais seulement de la distribution de la valeur du champs le long du rayon.

Nous avons vu que le champ électrique et le champ magnétique sont des concepts théoriques abstraits (cf. #champs-electrique) qui ne peuvent aucunement se voir dans la mesure où ils ne diffusent pas la lumière. La lumière est donc invisible, tout comme le champs magnétique qui attire une épingle sur un aimant. Pour bien comprendre cela il est utile de définir ce que signifie "être visible" ou encore "voir". Être visible signifie "réfléchir" la lumière, or un corps ne peut réfléchir la lumière que s'il est composé de matière. Si la lumière est invisible c'est parce qu'elle n'est pas de la matière. Elle ne peut donc ni réfléchir d'autres rayons, ni "frapper" la rétine.

Ainsi les rayons lasers que l'on croit "voir" (par exemple dans les boîtes de nuit) ne sont que des particules en suspension dans l'air (gouttelettes d'eau, poussières, ...), qui réfléchissent la lumière propagée par la source lumineuse : les charges électriques qui composent les atomes de ces particules sont mises en oscillation par le rayon laser, de sorte qu'elle vont réfléchir le rayon laser ⇒ certains des rayons réfléchis vont aller dans la direction de l'oeil de l'observateur. C'est le même phénomène que l'on observe lorsque les rayons du soleil traversent des nuages ou pénètrent dans un sous-bois humide (mais la couleur observée est bien celle de la lumière qui éclaire). Ainsi si la lumière était visible nous ne verrions rien d’autre que la lumière elle-même car elle masquerait les objets qui nous entourent.

Les lentilles
https://jortay.net/savoir-de-base#lentilles
lentille-spherique.png

Une lentille sphérique convergente a la forme d'une intersection de deux sphères.

Une lentille sphérique est caractérisée par son indice de réfraction (n), par son épaisseur et par les rayons de courbure de ses faces (c.-à-d. les rayons de chacune des deux sphères). S’ils ont la même valeur (R) la lentille est symétrique.

L’axe qui passe par les centres des sphères est l’axe optique de la lentille.

Les effets de cette lentille sur les rayons qui la traversent sont les suivants :

  • les rayons parallèles à l'axe optique convergent en un point de l'axe optique (le foyer de la lentille), et plus généralement les rayons seulement parallèles entre eux se croisent dans le plan focal de la lentille, plan perpendiculaire à l'axe optique et passant par le foyer ;
  • un rayon passant par le centre de la lentille n'est pas dévié.
plan-focal.png

À partir des deux effets ci-dessus ont peut déduire le trajet de n'importe quel rayon détourné par la lentille qu'il a traversée : il suffit de tracer sa parallèle passant par le centre de la lentille ⇒ son intersection avec le plan focal détermine le point focal, par lequel passe aussi le rayon dont on a pris la parallèle.

L'effet de cette lentille symétrique sur les rayons lumineux qui la traversent est modélisé par la loi de Snell-Descartes, relation exprimant la distance focale f (distance entre le centre de la lentille et son foyer) en fonction du rayon de courbure de la lentille et de l'indice de réfraction n de son matériaux : f = R / 2 * ( n - 1 ) [ n(verre)=1,5 ⇔ R=f ].

Cette modélisation est une approximation valable pour une lentille suffisamment mince, c’est-à-dire une lentille dont l’épaisseur est petite comparée à son diamètre et dont le diamètre est petit comparé aux rayons de courbures de ses faces. Pour des lentilles plus larges la concentration des rayons n'est plus ponctuelle.

Loi des lentilles. Soient les indices i pour "image" et o pour "objet", dans le graphique suivant les couples de triangles équivalents montrent que :
yi / yo = xi / xo (formule du grandissement)
yi / yo = - ( xi - f ) / f

xi / xo = - xi / f + 1    ⇔
1 / xo = - 1 / f + 1 / xi    ⇔
1 / xi - 1 / xo = 1 / f (relation de conjugaison)

Il s'agit de la conjugaison (taille et distance) entre points objet et image, qui sont dits "conjugués".

loi-optique-1.png

Quelques valeurs remarquables de la relation de conjugaison (et dont les valeurs son facilement vérifiables géométriquement) :

  • si  do = ∞  alors  di = f : un objet à l’infini a son image dans le plan focal ;
  • si  do = f  alors  di = ∞ : un objet dans le plan focal de la lentille a son image àl’infini ;
  • si  do = di  alors  do = di = 2 * f et l’image a la même taille que l’objet.

Si la distance séparant l'objet de la lentille est supérieure à 2*f, son image réfléchie par la lentille sera réduite, et tendra jusqu'à l'égalité au fur et à mesure que la distance objet (do) se rapprochera de 2f.

loi-optique-2.png

Un objet réfléchit dans toutes les directions la lumière qui l'éclaire, de sorte que les rayons qui arrivent dans la pupille de l'oeil ne sont pas parallèles (sauf si le point objet est située à l'infini).

Captage et enregistrement des images. Idéalement le foyer image et la paroi photosensible d'un enregistreur d'image (appareil photo, oeil humain, ...) doivent coïncider spatialement, sinon l'image d'un point objet ne sera pas un point mais une surface (le point est alors dit "flouté"). La mise au point (par l'oeil ou l'appareil photo) a pour fonction d'assurer cette coïncidence spatiale afin de minimiser le flou sur la partie souhaitée de l'image .

L'oeil humain est conçu pour concentrer un faisceau incident de rayons parallèles entre eux vers un point de sa rétine. Mais si les rayons proviennent d’un point proche, ils arrivent en divergeant. Sans adaptation de l'oeil, ils formeraient une tache lumineuse sur la rétine et ce point serait vu flou. Pour qu’ils soient malgré tout concentrés sur la rétine et qu'ainsi le point soit vu net, les muscles du cristallin se contractent pour le déformer et changer ses rayons de courbure (donc ses propriétés optiques).

La faculté d'adaptation de l'oeil a cependant ses limites : il existe une distance p ("punctum proximum") en-deçà de laquelle un objet ne pourra pas être vu net. Pour y remédier on peut utiliser une loupe.

La distance du punctum proximum augmente avec l’âge et dépend d’éventuels défauts de la vue (p. ex. myopie). Elle est géné-ralement comprise entre 10 cm et 50 cm.

lentille-loupe.png

Loupe et image virtuelle. Lorsque l'objet est situé à une distance inférieure à la distance focale, l'image est alors virtuelle : ce ne sont pas les rayons qui convergent mais leur prolongation virtuelle.

Le graphique suivant explique l'effet d'optique illustré par la photo ci-contre : l'image agrandie se situe virtuellement derrière l'oeil du personnage photographié, et ce que l'observateur voit c'est la projection de cette image. La loupe permet donc de situer le plan image au-delà du punctum proximum.

loupe-avec-ou-sans.png

La distance optimale entre l'oeil et la loupe est la distance focale car les rayons réfléchis par la loupe sont alors parallèles et l'oeil les concentrent en un point sur la rétine sans devoir s'adapter. On notera que dans ce cas l'image virtuelle est située à l'infini.

loupe-optimum.png

Le degré de grossissement (G) de la loupe est le rapport entre les tailles sur la rétine de deux images de l'objet : celle lorsqu’il est observé à la loupe à distance f et celle lorsqu’il est observé sans loupe à distance p. Le graphique montre que G = p / f.

triangle-clipedia.png Vidéo Clipedia : Les lentilles divergentes
Lentille
divergente

La lentille sphérique divergente est plus épaisse en ses bords qu'en son centre, contrairement à la lentille convergente. La distance focale d'une lentille divergente est négative, et son foyer est virtuel car déterminé par la prolongation virtuelle des rayons et non par les rayons eux-mêmes.

Plan focal image d'une lentille

plan-focal-image.png

Notez l'inversion des flèches de l'axe vertical

Rappel. La notion de foyer correspond à des rayons incidents parallèles. Le foyer image (réel ou virtuel) est donc toujours l’image (réelle ou virtuelle) d’un point à l’infini sur l’axe optique. Enfin la distance focale f est définie comme la valeur de l’abscisse (x) du foyer image.

photo-lentille-divergente.png

Le schéma suivant montre pourquoi l'image produite est plus petite que l'objet. Le lecteur pourra y vérifier facilement la cohérence avec la relation de conjugaison n_relation-conjugaison.

Le graphique suivant explique l'effet d'optique illustré par la photo ci-contre : le foyer image est devant la lentille et l'image réduite se situe entre celle-ci et le foyer.

lentille-divergente.png

Par le même type de construction géométrique on pourra facilement vérifier que si xo = f < 0 alors xi = f / 2, et que ce résultat est cohérent avec la formule de grandissement n_formule-grandissement.

Retour inverse. Si de la lumière est renvoyée sur elle-même, elle parcourt exactement le même rayon lumineux en sens contraire, y compris lorsqu’elle subit une réfraction. Cette propriété est la propriété de "retour inverse" de la lumière. Cette propriété est caractérisée par la notion de "foyer objet", dont le plan focal objet est symétrique au plan focal image c-à-d situé à une distance -f du centre de la lentille.

retour-inverse.png

Le graphique ci-dessus montre que les rayons lumineux qui proviennent d’un point du plan focal objet d’une lentille(convergente ou divergente) en ressortent sous forme d’un faisceau de rayon parallèles entre eux. L’image de ce point se trouve à l’infini. Si la lentille est divergente, un tel objet doit être virtuel (non démontré ici).

Le tableau suivant synthétise les propriétés des lentilles divergentes et convergentes.

Lentille
convergente
Lentille
divergente
foyer imageréel (après)virtuel (avant)
foyer objetréel (avant)virtuel (après)
distance focalepositivenégative
Avant/après est déterminé par rapport au sens de la lumière. Notez les symétries verticale et horizontale de ce tableau.
La vision
https://jortay.net/savoir-de-base#vision
triangle-clipedia.png Vidéo Clipedia : La vision

Cette vidéo illustre la précédente section en expliquant le phénomène biologique de la vision, uniquement du point de vue de la physique (ainsi notamment les aspects neurologiques ne sont pas traités).

Biologie

https://jortay.net/savoir-de-base#biologie
 8.1. La vie
 8.2. La cellule

La vie

https://jortay.net/savoir-de-base#la-vie
triangle-clipedia.png Vidéo Clipedia : La vie

La biologie est la science qui étudie les organismes vivants. Mais comment définir objectivement la vie, c-à-d par une définition permettant de classer sans hésitation tous les corps en deux groupes "vivants" et "non-vivants".

On utilise aussi les termes de corps "animé" vs "inanimé", du latin "animare" (« donner de la vie ») et "anima" (« souffle, vie »)

Définir la vie implique de comprendre ce qu'est le phénomène vital. Pour ce faire une première étape consiste à distinguer deux groupes :

  1. animal : organismes doté d'une "âme" (N.d.A. : = conscience ?)  ;
  2. végétal : qui végète c-à-d ne fait que respirer, se nourrir et croître.

N.d.A. On notera la structure hiérarchique induite par ces définitions : le règne animal est supérieur au règne végétal en ce sens qu'il englobe celui-ci, dont il possède les propriétés (respirer, se nourrir et croître). Nous allons voir que cette structure n'apparaît pourtant pas dans l'arbre phylogénétique de la vie.

Mais avec le progrès technologique, en particulier l'invention du microscope, on a découvert des types d'organismes, invisibles à l'oeil nu, que les biologistes considèrent comme n'appartenant ni au règne animal ni au règne végétal.

N.d.A. La définition supra du règne animal repose sur celle d'âme. Or il n'existe pas de définition objective de celle-ci (ni même de son existence). Dans ces conditions comment-est-il possible d'affirmer qu'un groupe quelconque ne peut être assimilé au règne animal dès lors que la définition de ce règne n'est pas elle-même satisfaisante ?

D'autre part la complexification constante de l'arbre phylogénétique de vie – qui montre des relations de parenté entre des groupes d'êtres vivants (ancêtre commun, descendants, groupes frères, ...) – révèle une grande diversité des formes de vie.

N.d.A. La nature toujours plus nombreuse et complexe du regroupement des organismes vivants est-elle l'expression d'un savoir croissant, ou aussi le signe que cette voie de recherche n'est pas suffisante ? D'autre part on notera qu'à deux reprises dans la vidéo le scientifique exprime sa satisfaction concernant le fait que les êtres vivants ont une parenté (7m02s et 7m32s). Je regrette cette démarche, non pas évidemment en raison de leur nature humaniste (que par ailleurs je partage), mais parce que ces incursions idéologiques dans le discours scientifique peuvent conduire à de graves dérives au regard de la méthode scientifique, à l'instar de celle documentée dans cet exemple.

Actuellement les biologistes s'accordent pour identifier trois critères définissant la nature vivante d'un organisme :

  • réponse à des stimuli : capacité à réagir et s'adapter à l'environnement (exemple : les feuilles des végétaux se tournent vers la lumière) ;
  • échanges avec l'environnement : notamment ingérer matière & énergie, puis évacuer des déchets ;
  • se reproduisent de façon autonome : existence d'ancêtres et descendants, multiplication et évolution.

Or les robots répondent à ces trois critères, ou sont en passe de le faire (ils pourraient théoriquement être programmés pour se reproduire tout en améliorant leur capacité). Faut-il en déduire que les robots sont des êtres vivants, ... ou bien que les trois critères ci-dessus ne sont pas pertinents pour définir la vie ?

N.d.A. Étrangement, dans la vidéo le scientifique n'évoquent pas cette seconde possibilité. S'agit-il d'une illustration des effets inhibiteurs que peuvent avoir les convictions idéologiques sur la méthode scientifique ? Ainsi à 13m26s le scientifique met le mot "vivant" entre guillemets ...

J'ajoute ce questionnement : dès lors que "être vivant" c'est (i) être né, et (ii) ne pas encore être décédé, peut-on en conclure que la vie est par nature un attribut non permanent ? Cette éventuelle nature non permanente pourrait-elle être liée aux principes physique de conservation (rien ne se créé, tout se transforme) et d'entropie ?

Science et humanisme

Les diverses N.d.A qu'il m'a semblé devoir ajouter dans cette section ont suscité chez moi un autre questionnement : l'expérience traumatisante du nazisme en 1940-45 a-t-elle influencé les résultats de la recherche scientifique en matière d'évolution, en y introduisant un biais humaniste pour remplacer un biais raciste ? Ce questionnement ne vise évidemment pas à remettre en cause l'idéal humaniste, mais à attirer l'attention sur le fait que l'intrusion de toute idéologie dans l'investigation scientifique peut détourner celle-ci de son objectif : découvrir la réalité. Or l'enfer peut être pavé de bonnes intentions, et l'histoire des sciences est caractérisée par des périodes de régression qui doivent nous inciter à ne jamais baisser la garde devant les risques d'intrusion de l'idéologie dans la démarche scientifique.

La cellule

https://jortay.net/savoir-de-base#cellule
triangle-clipedia.png Vidéo Clipedia : La cellule

La cellule est elle-même un organisme vivant, avec ceci de particulier qu'elle constitue l'organisme vivant élémentaire c-à-d tel que :

  • ses constituants ne sont pas des organismes vivants (notion de "machinerie cellulaire") ;
  • elle constitue la "brique élémentaire" dont sont faits tous les organismes vivants (NB : il existe des organismes composés d'une seule cellule, tel que l'euglène qui est une algue);

Les cellules exercent des fonctions biologiques (notion de métabolisme). Par exemple les globules rouges – qui sont un des trois types de cellules constitutives du sang (avec les globules blancs et les plaquettes) – ont pour effet de transporter les gaz respiratoires des poumons vers les organes.

Il existe différentes façons de classer les cellules en types de cellules, une d'elle consistant à distinguer cellules animales et cellules végétales. Mais la typologie la plus fondamentale est probablement celle distinguant les cellules selon qu'elles comportent ou pas un noyau :

  • procaryotes : cellules sans noyau (typiquement les bactéries) ; taille : 10-100 µm (1 μm = 10−6 m) ;
  • eucaryotes : cellules avec noyau (qui dans l'évolution de la vie sont apparues longtemps après les procaryotes) ; taille : 1-10 µm.

Étymologie : du grec, caryote : noyau, pro : avant, eu : bon.

Cellules, noyaux et d'autres composants de la cellule comportent notamment une membrane externe (en bleu dans l'image ci-dessous).

cellule-bacterienne.jpg

Cellule bactérienne

La cellule vérifie les trois critères définissant un organisme vivant :

  • réponse à des stimuli : elle peut détecter de la nourriture et se diriger vers elle, à l'aide de cils situés sur sa membrane ;
  • échanges avec l'environnement : au travers de sa membrane elle ingére matière & énergie, puis évacue des déchets ;
  • se reproduisent de façon autonome : elle se reproduit, par division cellulaire (pincement de la membrane).
triangle-clipedia.png Vidéo Clipedia : L’usine cellulaire

Le fait que les composants de la cellule ne sont pas eux-mêmes des organismes vivants posent une question passionnante : qu'est ce qui fait qu'un assemblage de corps non-vivants (la "machinerie cellulaire") devient vivant ? Qu'est-ce qui explique ce passage de la matière inerte à la matière animée ?

En fait nous avons déjà posé les prémisses de la réponse à cette question, dans la section #electricite-interaction, où nous avions montré le rôle fondamental joué par l'électricité dans les interactions dynamiques et chimiques entre atomes, via des forces d'attraction et répulsion. Nous avions vu ensuite le rôle complémentaire joué par la notion de différence de potentiel énergétique dans ces interactions.

Nous allons étudier ici comment ces phénomènes physiques et chimiques peuvent expliquer le passage de matière inerte à matière vivante. Pour ce faire nous allons grimper de l'échelle atomique à l'échelle moléculaire, puis à celle de cellule, et enfin aux tissus organiques. Les tissus organiques sont constitués de cellules organiques, elles mêmes composées de molécules chimiques, elles-mêmes constituées d'atomes.

Le passage de la matière inerte à la matière vivante est le fruit d'interactions entre atomes et molécules, interactions qui ne sont plus soumises au seul hasard, mais visent également un objectif. Celui-ci est de maintenir un équilibre vital entre l'organisme vivant et son environnement (notion de métabolisme). Cette préservation d'un équilibre vital est un mécanisme d'adaptation, qui requiert un système de gestion des fonctions vitales.

metabolisme.jpg

Il y a là une analogie flagrante avec le système d'exploitation d'un ordinateur, qui gère le bon fonctionnement de ses programmes (le système d'exploitation, étant un programme gérant les autres, est qualifié de "méta-programme"). Par exemple lorsque la température des processeurs dépasse un certain niveau, le ventilateur est automatiquement actionné par le système d'exploitation, jusqu'à ce que la température des processeurs soit redescendue en-dessous de la limite maximale programmée.

Unité de
production

Le métabolisme des organismes vivants ne gèrent pas que le traitement d'informations (les bits pour l'ordinateur) et d'énergie (l'électricité et la chaleur pour l'ordinateur), mais plus généralement de matière. La cellule peut donc être vue comme unité de production (de "biens" et "services") de base. À titre d'illustration, on pourrait faire les analogies du tableau suivant (NB : toute analogie est partiellement abusive ou restrictive).

UsineCellule
Protectionenceintemembrane cellulaire
Inputmatière première + énergie
Outputproduits/services finis + déchets (*)
Productionouvriers + machinesmolécules
Gestiondirection + ingénieursADN

(*) La notion de "déchet" est relative : ce qui est inutile voire toxique par un organisme peut utile pour un autre type d'organisme.

Molécule

Le tableau et le schéma supra suggèrent que c'est au niveau des molécules qu'opèrent les mécanismes par lesquels des corps non vivants constituent l'organisme vivant élémentaire qu'est la cellule.

Nous avons vu qu'une molécule est un assemblage d'atomes liés par des forces électrique (cf. #electricite-interaction). Deux molécules importantes du phénomène vital sont :

  • le glucose (C6H12O6) : est un sucre, utilisé comme source d'énergie par la plupart des organismes vivants ;
  • la cystéine (C3H7NO2S) : est un acide aminé, molécules de base des protéines, qui sont des chaînes d'acides aminés.
Agencement
spatial

Une autre molécule célèbre est le cholestérol (C27H46O) dont l'intérêt est ici de montrer que les molécules peuvent êtres composées d'un grand nombre de chacun de leur atomes, de sorte que l'agencement spatial de ces molécules peut prendre un grand nombre de formes différentes (par conséquent la représentation imagées des molécules, sous formes de sphères reliées par des bâtonnets, ne fait sens que pour des molécules simples).

Le grand nombre de molécules différentes (des milliards de milliards), et partant leur variété et complexité, est le résultat d'un nombre étonnamment limité d'atomes : une centaines connus à ce jour. Et cette économie de moyens est encore plus frappante dans le cas des molécules biologiques (c-à-d constitutive de cellules) dont la quasi totalité est composée de ... six type d'atomes différents : carbone, hydrogène, oxygène, azote, phosphore et souffre (CHONPS).

L'agencement spatial des atomes d'une molécule est un élément fondamental de l'organisation cellulaire. C'est le cas des phospholipides dont la forme est caractéristique :

  • une tête : hydrophile, centrée ici sur un atome de phosphore. ;
  • une double queue : hydrophobe, sous forme de chaînes lipidiques.
phospholipide.jpg

Phospholipide

micelle.jpg

Coupe d'une micelle de phospholipides

Ces propriétés mécanique (leur forme) et chimique (interaction attractive ou répulsive avec l'eau), ont pour effet que, lorsqu'ils baignent dans l'eau, les phospholipides réagissent automatiquement en s'organisant spatialement, selon une régle simple : les têtes s'orientent vers l'eau, tandis que les queues s'orientent dans le sens opposé. Ainsi, s'ils sont suffisamment nombreux, ils forment alors une micelle de phospholipides.

micelle2.jpg

Coupe d'une micelle de phospholipides

Dans cette dynamique il peut arriver qu'une micelle se construise autour d'une masse d'eau. Les mêmes règles d'orientation conduisent alors automatiquement à une structure de type "sphère avec noyau" dont les surfaces externe et interne sont constituées par les têtes hydrophiles.

bicouche-lipidique.jpg

Bicouche lipidique

La parois de cette sphère est ainsi composée d'un bicouche lipidique, que l'on peut voir également comme une ... membrane cellulaire !

n_check

Infos

jortay.net

top-of-page.png