Anwendungen des Gradienten

 Mit Hilfe des Gradienten können wir die Richtungsableitung einer Funktion in einfacher Weise berechnen. Es gilt der folgende Satz:

Satz (Gradient und Richtungsableitung)

Sei f : P   stetig differenzierbar an der Stelle p  ∈  P. Weiter sei w = (w1, …, wn)  ∈  n normiert. Dann existiert ∂w f (p) und es gilt

(+)  ∂w f (p)  =  〈 grad f (p), w 〉  =  1 ≤ j ≤ njf (p) wj.

 Zur Begründung betrachten wir wieder den anschaulichen Spezialfall n = 2. Hier ergibt sich der Satz wie folgt:

(1)

Die Aussage lässt sich elementar beweisen, falls die Funktion f eine Ebene ist (also mit ihrer Tangentialebene an der Stelle p übereinstimmt).

(2)

Die Formel (+) überträgt sich (unter guten Voraussetzungen der Differenzierbarkeit) von der Tangentialebene auf die Funktion.

 Eine weitere wichtige Anwendung des Gradienten betrifft Extremwerte:

Definition (lokale Extremalstelle)

Sei f : P  . Dann heißt ein p  ∈  P eine lokale Maximalstelle von f, falls gilt:

∃ε > 0 ∀x  ∈  P (∥ x − p ∥ < ε    f (x)  ≤  f (p)).

Gilt stärker

∃ε > 0 ∀x  ∈  P (∥ x − p ∥ < ε  ∧  x ≠ p    f (x)  <  f (p)),

so heißt p eine strikte lokale Maximalstelle. Analog ist eine (strikte) lokale Minimalstelle definiert. Ist p eine (strikte) lokale Minimal- oder Maximalstelle, so heißt p eine (strikte) lokale Extremalstelle und f (p) ein zugehöriger lokaler Extremwert von f.

 Ist p eine lokale Extremalstelle einer partiell differenzierbaren Funktion, so ist die Richtungsableitung von f an der Stelle p für alle Richtungen w gleich Null, da andernfalls f in einer gewissen Richtung w steigen oder fallen würde. Damit gilt:

Satz (notwendige Bedingung für ein lokales Extremum)

Sei f : P   partiell differenzierbar an der lokalen Extremalstelle p  ∈  P. Dann gilt grad f (p) = 0.

 Das Ergebnis erweitert die klassische notwendige Bedingung f ′(p) = 0 für lokale Extrema einer reellen Funktion. Das Verschwinden des Gradienten ist keine hinreichende Bedingung: Das eindimensionale Beispiel f :    mit f (x) = x3 und f ′(0) = 0 wird im Mehrdimensionalen ergänzt durch die Sattelfläche f : 2   mit f(x, y) = x2 − y2. Hier gilt grad f (0) = 0, aber die Funktion besitzt im Nullpunkt weder ein lokales Maximum noch ein lokales Minimum.

 Ein hinreichendes Kriterium für ein striktes lokales Minimum einer reellen Funktion an einer kritischen Stelle p (d. h. f ′(p) = 0) ist, dass f ″(p) > 0. Um ein mehrdimensionales Analogon dieses Kriteriums formulieren zu können, brauchen wir eine mehrdimensionale Version einer „zweiten Ableitung“:

Definition (Hesse-Matrix)

Sei f : P   zweimal partiell differenzierbar, und sei p  ∈  P. Dann ist die Hesse-Matrix Hf(p) von f an der Stelle p definiert durch

Hf(p)  =  (i ∂jf (p))1 ≤ i, j ≤ n.

 Die Hesse-Matrix Hf(p) ist eine reelle (n × n)-Matrix, deren Einträge aus allen zweiten partiellen Ableitungen von f an der Stelle p bestehen. Ist f zweimal stetig differenzierbar, so ist die Hesse-Matrix symmetrisch nach dem Satz von Schwarz. In der Analysis zeigt man den folgenden Satz:

Satz (hinreichende Bedingung für ein lokales Extremum)

Sei f : P   zweimal stetig differenzierbar, und sei p  ∈  P mit grad f (p) = 0.

Weiter sei die Hesse-Matrix H = Hf(p) positiv definit, d. h. es gelte

〈 x, H x 〉 > 0  für alle x  ∈  n mit x ≠ 0.

Dann ist p eine strikte lokale Minimalstelle von f.

 An die Stelle von f ″(p) > 0 tritt also positive Definitheit der Hesse-Matrix H = Hf(p). Um letztere festzustellen, stehen verschiedene Möglichkeiten zur Verfügung. Für den Fall n = 2 sind zum Beispiel äquivalent:

(a)

H ist positiv definit, d. h. 〈 (x, y), H(x, y) 〉 > 0 für alle (x, y) ≠ 0.

(b)

H(1, 1) = ∂11f (p) > 0  und  det(H) = ∂11f (p) ∂22f (p) − (∂12f (p))2 > 0.

(c)

Alle Eigenwerte von H sind positiv.

Beispiel

Sei f : 2   mit f(x, y) = x2 + y2 − 2x + 2y + 2. Dann gilt

grad f (x, y)  =  (2x − 2, 2y + 2).

Damit hat f höchstens im Punkt p = (1, −1) ein lokales Extremum. Die Hesse-Matrix Hf(p) = ((2, 0); (0, 2)) ist positiv definit, sodass p eine strikte lokale Minimalstelle von f ist. Dies lässt sich auch geometrisch einsehen, da f(x, y) = (x − 1)2 + (y + 1)2 ein nach oben geöffnetes Paraboloid ist.

 Strikte lokale Maximalstellen können wir durch Übergang zu −f untersuchen oder analoge Ergebnisse mit „die Hess-Matrix H ist negativ definit“ formulieren (d. h. 〈 x, H x 〉 < 0 für alle x  ∈  n mit x ≠ 0).