Anwendungen des Gradienten

Mit Hilfe des Gradienten können wir die Richtungsableitung einer Funktion in einfacher Weise berechnen. Es gilt der folgende Satz:

Satz (Gradient und Richtungsableitung)

Sei f : P → ℝ stetig differenzierbar an der Stelle p  ∈  P. Weiter sei w = (w₁, …, w_n)  ∈  ℝⁿ normiert. Dann existiert ∂_w f (p) und es gilt

(+) ∂_w f (p) = 〈 grad f (p), w 〉 = ∑_{1 ≤ j ≤ n} ∂_jf (p) w_j.

Zur Begründung betrachten wir wieder den anschaulichen Spezialfall n = 2. Hier ergibt sich der Satz wie folgt:

(1)	Die Aussage lässt sich elementar beweisen, falls die Funktion f eine Ebene ist (also mit ihrer Tangentialebene an der Stelle p übereinstimmt).

(2)	Die Formel (+) überträgt sich (unter guten Voraussetzungen der Differenzierbarkeit) von der Tangentialebene auf die Funktion.

Eine weitere wichtige Anwendung des Gradienten betrifft Extremwerte:

Definition (lokale Extremalstelle)

Sei f : P → ℝ. Dann heißt ein p  ∈  P eine lokale Maximalstelle von f, falls gilt:

∃ε > 0 ∀x  ∈  P (∥ x − p ∥ < ε → f (x) ≤ f (p)).

Gilt stärker

∃ε > 0 ∀x  ∈  P (∥ x − p ∥ < ε ∧ x ≠ p → f (x) < f (p)),

so heißt p eine strikte lokale Maximalstelle. Analog ist eine (strikte) lokale Minimalstelle definiert. Ist p eine (strikte) lokale Minimal- oder Maximalstelle, so heißt p eine (strikte) lokale Extremalstelle und f (p) ein zugehöriger lokaler Extremwert von f.

Ist p eine lokale Extremalstelle einer partiell differenzierbaren Funktion, so ist die Richtungsableitung von f an der Stelle p für alle Richtungen w gleich Null, da andernfalls f in einer gewissen Richtung w steigen oder fallen würde. Damit gilt:

Satz (notwendige Bedingung für ein lokales Extremum)

Sei f : P → ℝ partiell differenzierbar an der lokalen Extremalstelle p  ∈  P. Dann gilt grad f (p) = 0.

Das Ergebnis erweitert die klassische notwendige Bedingung f ′(p) = 0 für lokale Extrema einer reellen Funktion. Das Verschwinden des Gradienten ist keine hinreichende Bedingung: Das eindimensionale Beispiel f : ℝ → ℝ mit f (x) = x³ und f ′(0) = 0 wird im Mehrdimensionalen ergänzt durch die Sattelfläche f : ℝ² → ℝ mit f(x, y) = x² − y². Hier gilt grad f (0) = 0, aber die Funktion besitzt im Nullpunkt weder ein lokales Maximum noch ein lokales Minimum.

Ein hinreichendes Kriterium für ein striktes lokales Minimum einer reellen Funktion an einer kritischen Stelle p (d. h. f ′(p) = 0) ist, dass f ″(p) > 0. Um ein mehrdimensionales Analogon dieses Kriteriums formulieren zu können, brauchen wir eine mehrdimensionale Version einer „zweiten Ableitung“:

Definition (Hesse-Matrix)

Sei f : P → ℝ zweimal partiell differenzierbar, und sei p  ∈  P. Dann ist die Hesse-Matrix H_f(p) von f an der Stelle p definiert durch

H_f(p) = (∂_i ∂_jf (p))_{1 ≤ i, j ≤ n}.

Die Hesse-Matrix H_f(p) ist eine reelle (n × n)-Matrix, deren Einträge aus allen zweiten partiellen Ableitungen von f an der Stelle p bestehen. Ist f zweimal stetig differenzierbar, so ist die Hesse-Matrix symmetrisch nach dem Satz von Schwarz. In der Analysis zeigt man den folgenden Satz:

Satz (hinreichende Bedingung für ein lokales Extremum)

Sei f : P → ℝ zweimal stetig differenzierbar, und sei p  ∈  P mit grad f (p) = 0.

Weiter sei die Hesse-Matrix H = H_f(p) positiv definit, d. h. es gelte

〈 x, H x 〉 > 0 für alle x  ∈  ℝⁿ mit x ≠ 0.

Dann ist p eine strikte lokale Minimalstelle von f.

An die Stelle von f ″(p) > 0 tritt also positive Definitheit der Hesse-Matrix H = H_f(p). Um letztere festzustellen, stehen verschiedene Möglichkeiten zur Verfügung. Für den Fall n = 2 sind zum Beispiel äquivalent:

(a)	H ist positiv definit, d. h. 〈 (x, y), H(x, y) 〉 > 0 für alle (x, y) ≠ 0.

(b)	H(1, 1) = ∂₁₁f (p) > 0 und det(H) = ∂₁₁f (p) ∂₂₂f (p) − (∂₁₂f (p))² > 0.

(c)	Alle Eigenwerte von H sind positiv.

Beispiel

Sei f : ℝ² → ℝ mit f(x, y) = x² + y² − 2x + 2y + 2. Dann gilt

grad f (x, y) = (2x − 2, 2y + 2).

Damit hat f höchstens im Punkt p = (1, −1) ein lokales Extremum. Die Hesse-Matrix H_f(p) = ((2, 0); (0, 2)) ist positiv definit, sodass p eine strikte lokale Minimalstelle von f ist. Dies lässt sich auch geometrisch einsehen, da f(x, y) = (x − 1)² + (y + 1)² ein nach oben geöffnetes Paraboloid ist.

Strikte lokale Maximalstellen können wir durch Übergang zu −f untersuchen oder analoge Ergebnisse mit „die Hess-Matrix H ist negativ definit“ formulieren (d. h. 〈 x, H x 〉 < 0 für alle x  ∈  ℝⁿ mit x ≠ 0).