background image

Cauchy-Schwarz par le calcul diff´erentiel

Dominique Hoareau, 26-10-2003

domeh@wanadoo.fr

On propose de d´emontrer le th´eor`eme du multiplicateur de Lagrange (ou

th´eor`eme des extrema li´es), accessible d`es que l´on dispose du th´eor`eme des

fonctions implicites dans

R

2

, puis on l´utilise pour justifier l´in´egalit´e de

Cauchy-Schwarz.

Fonctions implicites : cas de deux variables r´eelles

Enonc

´

e

: Soit

U

un ouvert non vide de

R

2

,

f

:

U

→

R

une fonction

C

1

,

(

a, b

)

∈

U

tel que :

f

(

a, b

) = 0

.

On suppose que

∂f

∂y

(

a, b

)

6

= 0

.

Alors il existe :

•

des voisinages ouverts

I

et

J

de

a

et

b

•

une fonction

ϕ

:

I

→

R

C

1

tels que :

∀

(

x, y

)

∈

U

[(

x, y

)

∈

I

×

J et f

(

x, y

) = 0]

⇔

[

x

∈

I et y

=

ϕ

(

x

)]

.

La d´erivation licite par rapport `a

x

dans la relation

f

(

x, Ď•

(

x

)) = 0 donne :

∀

x

∈

I Ď•

0

(

x

) =

−

∂f

∂x

(

x, Ď•

(

x

))

∂f

∂y

(

x, Ď•

(

x

))

.

Commentaire

: Sous les conditions du th´eor`eme, apr`es un zoom sur le point

(

a, b

), la ligne de niveau 0 de

f

est, dans la â€lucarne”

I

×

J

(localement autour

de (

a, b

)), le graphe d´une fonction

ϕ

de classe

C

1

.

Sa tangente au point

a

est dirig´ee par le vecteur

Âľ

1

,

−

∂f

∂x

(

a,b

)

∂f

∂y

(

a,b

)

Âś

qui est orthogonal `a la direction

(

∂f

∂x

(

a, b

)

,

∂f

∂y

(

a, b

)

.

La condition

∂f

∂y

(

a, b

)

6

= 0 s´interpr`ete donc intuitivement

comme la donn´ee d´une â€tangente non verticale” en (

a, b

) pour la courbe

d´´equation

f

(

x, y

) = 0

.

1 Th´eor`eme du multiplicateur de Lagrange

´

Enonc´e

Soit

U

un ouvert non vide de

R

n

,

f

:

U

→

R

et

g

:

U

→

R

deux fonctions

C

1

.

On pose :

M

=

{

x

∈

U

;

g

(

x

) = 0

}

.

Soit

a

∈

M

tel que

dg

a

6

= 0

.

Si

f

|

M

pr´esente en

a

un extr´emum local, alors il existe un r´eel

ν

, appel´e

multiplicateur de Lagrange, tel que

df

a

=

νdg

a

.

Interpr´etation

En tout point

a

extr´emum de

f

sur

M

, la ligne de niveau

f

(

a

) de

f

et

M

ont mˆeme â€espace tangent en

a

” (

ker df

a

=

ker dg

a

). En notant

< , >

le

1

background image

produit scalaire usuel de

R

n

, on peut dire que les vecteurs gradients

5

f

a

et

5

g

a

d´efinis par

df

a

=

<

5

f

a

,

•

>

et

dg

a

=

<

5

g

a

,

•

>

, sont colin´eaires.

Preuve

On choisit

v

dans

R

n

tel que :

dg

a

.v

6

= 0

.

Soit

u

∈

R

n

.

On pose :

Ω =

{

(

Îť, Âľ

)

∈

R

2

;

a

+

Îťu

+

Âľv

∈

U

}

.

Puisque

U

est un ouvert de

R

n

contenant

a

et (

Îť, Âľ

)

7→

a

+

Îťu

+

Âľv

est

continue sur

R

2

, â„Ś est un ouvert de

R

2

contenant (0

,

0)

.

Soit Î¨ l´application

(

Îť, Âľ

)

7→

g

(

a

+

Îťu

+

Âľv

) de â„Ś dans

R

.

Ψ est

C

1

sur â„Ś car compos´ee de

fonctions

C

1

.

De plus :

∂

Ψ

∂µ

(0

,

0) =

dg

a

.v

6

= 0 donc le th´eor`eme des fonctions

implicites permet d´exprimer localement

Âľ

en fonction de

Îť

: on choisit

Îą >

0 et

h

: ]

−

Îą, Îą

[

→

R

C

1

tels que :

∀

Îť

∈

]

−

Îą, Îą

[ (

Îť, h

(

Îť

))

∈

Ω;

h

(0) = 0; Î¨(

Îť, h

(

Îť

)) = 0

.

On consid`ere alors l´application

F

:

Îť

7→

f

(

a

+

Îťu

+

h

(

Îť

)

v

) de ]

−

Îą, Îą

[ dans

R

.

On a d´eplac´e le probl`eme initial vers un probl`eme d´une seule variable.

F

est

C

1

et pr´esente un extr´emum local en 0 (int´erieur `a ]

−

Îą, Îą

[) donc :

F

0

(0) = 0

.

Par ailleurs :

F

0

(0) =

df

a

.

(

u

+

h

0

(0)

v

) =

df

a

.

(

u

−

∂

Ψ

∂λ

(0

,

0)

∂

Ψ

∂µ

(0

,

0)

v

) =

df

a

.

(

u

−

dg

a

.u

dg

a

.v

v

)

donc

df

a

.u

=

df

a

.

(

dg

a

.u

dg

a

.v

v

) =

df

a

.v

dg

a

.v

dg

a

.u.

On a trouv´e

ν

=

df

a

.v

dg

a

.v

ind´ependant

de

u

tel que :

df

a

.u

=

νdg

a

.u.

D´o`u :

df

a

=

νdg

a

.

Voici deux applications du th´eor`eme du multiplicateur de Lagrange.

Caract´erisation de

SO

(

n,

R

)

dans

SL

(

n,

R

)

(cf

T h

`

emes de g

´

eom

´

etrie

, M. Alessandri, Dunod)

M

n

(

R

) est muni du produit scalaire classique :

< A, B >

=

trace

(

t

AB

)

.

On veut calculer la distance euclidienne entre la matrice nulle et le ferm´e

SL

(

n,

R

) de

M

n

(

R

)

.

Il s´agit donc de minimiser

f

:

M

7→

< M, M >

sous

la contrainte

g

(

M

) =

det

(

M

)

−

1 = 0

.

Soit

d

cette distance. Pour tout

p

∈

N

∗

, la boule ferm´ee

B

p

de centre 0 et

de rayon

d

+

1

p

rencontre

SL

(

n,

R

) d´o`u l´existence d´une suite (

M

p

)

p

>

1

de

SL

(

n,

R

) telle que :

∀

p

∈

N

∗

d

6

k

M

p

k

6

d

+

1

p

.

Par compacit´e des

B

p

(ferm´es born´es en dimension finie), quitte `a en extraire une sous-suite, on

peut supposer que (

M

p

) converge. Sa limite not´ee

M

0

appartient au ferm´e

SL

(

n,

R

) =

det

−

1

(

{

1

}

) et v´erifie

< M

0

, M

0

>

=

d

2

(passage `a la limite). On

retiendra qu´en dimension finie, la distance `a un ferm´e est toujours atteinte

(argument de locale compacit´e).

2

background image

On a de fa¸con classique :

df

M

0

=

<

2

M

0

,

•

>

;

dg

M

0

=

< com

(

M

0

)

,

•

>

o`u

com

(

M

0

) d´esigne la comatrice de

M

0

(cf infra). Par le th´eor`eme du

multiplicateur de Lagrange, il existe

ν

∈

R

tel que :

M

0

=

νcom

(

M

0

)

.

On

a :

M

−

1

0

=

t

(

com M

0

) donc

t

M

0

M

0

=

νI.

Il vient :

det

(

t

M

0

M

0

) =

ν

n

= 1

avec, puisque

t

M

0

M

0

sym´etrique d´efinie positive,

ν

∈

R

∗

+

.

De l`a :

ν

= 1 et

M

0

∈

SO

(

n,

R

)

.

Or, pour

M

∈

SO

(

n,

R

),

< M, M >

=

n

donc

d

=

√

n

et

on a caract´eris´e

SO

(

n,

R

) dans

SL

(

n,

R

) comme l´ensemble des Â´el´ements de

norme euclidienne minimum.

Justification rapide de :

∀

M

∈

GL

n

(

R

)

d det

M

=

< com M,

•

> .

Pour

H

∈ M

n

(

R

),

det

(

M

+

H

) =

det

(

M

)

det

(

I

+

M

−

1

H

)

.

Or, si on note

E

i,j

la matrice Â´el´ementaire

n

×

n

avec des z´eros partout sauf un 1 en position (

i, j

),

pour

H

= [

h

i,j

], on a :

d det

I

.H

=

P

1

6

i,j

6

n

h

i,j

d det

I

.E

i,j

.

On remarque

que :

det

(

I

+

E

i,j

) =

det

(

I

) si

i

6

=

j

,

det

(

I

+

E

i,j

) =

det

(

I

) + 1 sinon. D´o`u :

d det

I

.H

=

trace

(

H

), et

d det

M

.H

=

det

(

M

)

trace

(

M

−

1

H

)

=

trace

(

t

com

(

M

)

H

)

.

cqfd.

In´egalit´e arithm´etico-g´eom´etrique

(

les maths en t

ˆ

ete

, Gourdon, Ellipses)

Montrer que :

∀

(

x

1

, ..., x

n

)

∈

(

R

∗

+

)

n

(

Q

1

6

i

6

n

x

i

)

1

n

6

P

n

i

=1

x

i

n

.

On envisage

f

: (

x

1

, ..., x

n

)

∈

R

n

7→

Q

1

6

i

6

n

x

i

et, pour

s >

0,

g

s

: (

x

1

, ..., x

n

)

∈

R

n

7→

P

n

i

=1

x

i

−

s.

On pose

M

s

=

g

−

1

s

{

0

}

. f

est continue

sur le compact

K

s

=

M

s

∊

(

R

+

)

n

(ferm´e born´e de

R

n

), donc

f

|

K

s

admet un

maximum

global

atteint en un

a

= (

a

1

, ..., a

n

) de

K

s

.

a

est n´ecessairement

dans l´ouvert relatif

M

s

∊

(

R

∗

+

)

n

de

M

s

. a

est donc un maximum

relatif

de

f

sous la liaison

M

s

, et par le th´eor`eme des extrema li´es, il existe

ν

∈

R

tel que :

5

f

a

=

ν.

5

(

g

s

)

a

.

On a donc :

∀

i

∈ {

1

, ..., n

}

f

(

a

)

a

i

=

ν

, ce qui

prouve, puisque

f

(

a

)

6

= 0, que les

a

i

sont Â´egaux :

∀

1

6

i

6

n a

i

=

s

n

.

Bilan :

∀

(

x

1

, ..., x

n

)

∈

(

R

∗

+

)

n

Q

1

6

i

6

n

x

i

6

Âł

P

n

i

=1

x

i

n

´

n

.

2 Multiplicateur de Lagrange

contre Cauchy-Schwarz

dans la Diagonalisation des

endomorphismes sym´etriques de

R

n

(cf

RMS

−

d

´

ecembre

−

1989, J.B Hirriart-Urruty et G. Lion, Vuibert)

On rappelle la version g´en´erale de :

3

background image

In´egalit´e de Cauchy-Schwarz

Soit

B

une forme bilin´eaire sym´etrique sur

R

n

.

On suppose que la forme

quadratique

Q

associ´ee `a

B

est positive (

∀

x

∈

R

n

Q

(

x

)

>

0).

Pour tous

x

et

y

de

R

n

, on a :

B

(

x, y

)

2

6

Q

(

x

)

Q

(

y

)

.

Lorsqu´on Â´etudie la r´eduction d´un endomorphisme sym´etrique

u

de

R

n

,

on commence par prouver que

u

poss`ede au moins une valeur propre r´eelle.

On note

< , >

le produit scalaire usuel de

R

n

et

k k

la norme associ´ee.

On consid`ere la forme bilin´eaire sym´etrique

B

de

R

n

d´efinie par

B

(

x, y

) =

<

x, u

(

y

)

>

, et la forme quadratique

Q

associ´ee.

Q

est continue sur le compact

S

=

{

x

∈

R

n

;

< x, x >

= 1

}

donc atteint ses bornes sur

S

. On pose

Îť

= max

x

∈

S

Q

(

x

) et on choisit

x

0

sur

S

tel que :

Q

(

x

0

) =

Îť.

La forme

quadratique

Q

1

:

x

7→

Îť

k

x

k

2

−

Q

(

x

) est positive donc par Cauchy-

Schwarz,

B

1

(

x, x

0

)

2

6

Q

1

(

x

)

Q

1

(

x

0

) o`u

B

1

d´esigne la forme polaire de

Q

1

.

Avec

Q

1

(

x

0

) = 0,

∀

x

∈

R

n

< x, Îťx

0

−

u

(

x

0

)

>

6

0

.

En particulier pour

x

=

Îťx

0

−

u

(

x

0

), on obtient :

Îťx

0

−

u

(

x

0

) = 0

.

Autre vision de l´affaire (cf

Calcul differentiel

, Avez, Masson) :

x

0

maximise

Q

sous la contrainte

h

(

x

) =

< x, x >

−

1 = 0

.

On a donc

5

Q

x

0

colin´eaire `a

5

h

x

0

, ce qui donne avec

u

sym´etrique :

u

(

x

0

) colin´eaire `a

x

0

.

3 Cauchy-Schwarz et les extrema li´es

Version d´emontr´ee

< , >

d´esigne un produit scalaire sur

R

n

et

k k

la norme associ´ee.

(CS) : pour tous

x

et

y

de

R

n

,

< x, y >

2

6

k

x

k

2

k

y

k

2

.

Preuve

Soit

x

∈

R

n

.

•

si

x

= 0, (CS) est clairement v´erifi´ee pour tout

y

de

R

n

.

•

On suppose `a pr´esent

x

6

= 0

.

On pose :

S

=

{

x

∈

R

n

;

k

x

k

= 1

}

.

,

→

On envisage les applications

f

:

y

7→

< x, y >

2

− k

x

k

2

k

y

k

2

et

g

:

y

7→k

y

k

2

−

1 de

R

n

dans

R

.

L´application

< x,

•

>

, forme lin´eaire sur

R

n

, et

y

7→k

y

k

2

sont continues sur

R

n

donc

f

l´est aussi ; sur le compact

S

(ferm´e born´e en dimension finie),

f

atteint sa borne sup´erieure, par exemple

en

y

0

.

,

→

Pour

y

∈

R

n

et

h

∈

R

n

,

f

(

y

+

h

) =

f

(

y

) + 2

­

< x, y > x

− k

x

k

2

y, h

ÂŽ

|

{z

}

lin

´

eaire en h

+

< x, h >

2

− k

x

k

2

k

h

k

2

|

{z

}

N

(

h

)

.

On remarque :

N

(

h

)

k

h

k

=

Âż

x,

h

k

h

k

1

2

À

2

− k

x

k

2

k

h

k

.

Par continuit´e des

4

background image

applications

h

7→k

h

k

et

h

7→

< x, h >

2

en 0, on a : lim

h

→

0

N

(

h

)

k

h

k

= 0

.

De l`a,

f

est diff´erentiable en

y

et :

df

y

= 2

­

< x, y > x

− k

x

k

2

y,

•

ÂŽ

.

y

7→

df

y

est clairement lin´eaire de

R

n

dans son dual (alg´ebrique, et topolo-

gique) donc

f

est

C

1

sur

R

n

.

On v´erifie que

g

est diff´erentiable en tout

y

de

R

n

,

dg

y

=

<

2

y,

•

>

, et

g

est

C

1

sur

R

n

.

,

→

Par le th´eor`eme des extr´ema li´es, on trouve

Îť

∈

R

tel que :

2[

< x, y

0

> x

− k

x

k

2

y

0

] =

Îť

2

y

0

c-`a-d :

[

Îť

+

k

x

k

2

]

y

0

=

< x, y

0

> x.

Si

< x, y

0

>

= 0,

f

(

y

0

) =

− k

x

k

2

k

y

0

k

2

6

0, et pour tout

y

de

S

,

f

(

y

)

6

0

.

Si

< x, y

0

>

6

= 0, on remplace

x

par

[

Îť

+

k

x

k

2

]

<x,y

0

>

y

0

dans

f

(

y

0

) et on trouve :

f

(

y

0

) = 0, ce qui donne encore :

∀

y

∈

S f

(

y

)

6

0

.

,

→

L´in´egalit´e

f

(

y

)

6

0 vraie sur

S

l´est encore sur

R

n

\{

0

}

par homog´en´eit´e.

Pour

y

6

= 0, on a :

f

Âł

y

k

y

k

´

6

0, c-`a-d :

1

k

y

k

2

< x, y >

2

− k

x

k

2

6

0, ou

encore :

< x, y >

2

− k

x

k

2

k

y

k

2

6

0

.

Enfin,

f

(0) = 0, ce qui termine la preuve.

Remerciements `a Dany-Jack Mercier pour sa lecture attentive du texte.

5