Anwendungen des Gradienten
Mit Hilfe des Gradienten können wir die Richtungsableitung einer Funktion in einfacher Weise berechnen. Es gilt der folgende Satz:
Satz (Gradient und Richtungsableitung)
Sei f : P → ℝ stetig differenzierbar an der Stelle p ∈ P. Weiter sei w = (w1, …, wn) ∈ ℝn normiert. Dann existiert ∂w f (p) und es gilt
(+) ∂w f (p) = 〈 grad f (p), w 〉 = ∑1 ≤ j ≤ n ∂jf (p) wj.
Zur Begründung betrachten wir wieder den anschaulichen Spezialfall n = 2. Hier ergibt sich der Satz wie folgt:
(1) | Die Aussage lässt sich elementar beweisen, falls die Funktion f eine Ebene ist (also mit ihrer Tangentialebene an der Stelle p übereinstimmt). |
(2) | Die Formel (+) überträgt sich (unter guten Voraussetzungen der Differenzierbarkeit) von der Tangentialebene auf die Funktion. |
Eine weitere wichtige Anwendung des Gradienten betrifft Extremwerte:
Definition (lokale Extremalstelle)
Sei f : P → ℝ. Dann heißt ein p ∈ P eine lokale Maximalstelle von f, falls gilt:
∃ε > 0 ∀x ∈ P (∥ x − p ∥ < ε → f (x) ≤ f (p)).
Gilt stärker
∃ε > 0 ∀x ∈ P (∥ x − p ∥ < ε ∧ x ≠ p → f (x) < f (p)),
so heißt p eine strikte lokale Maximalstelle. Analog ist eine (strikte) lokale Minimalstelle definiert. Ist p eine (strikte) lokale Minimal- oder Maximalstelle, so heißt p eine (strikte) lokale Extremalstelle und f (p) ein zugehöriger lokaler Extremwert von f.
Ist p eine lokale Extremalstelle einer partiell differenzierbaren Funktion, so ist die Richtungsableitung von f an der Stelle p für alle Richtungen w gleich Null, da andernfalls f in einer gewissen Richtung w steigen oder fallen würde. Damit gilt:
Satz (notwendige Bedingung für ein lokales Extremum)
Sei f : P → ℝ partiell differenzierbar an der lokalen Extremalstelle p ∈ P. Dann gilt grad f (p) = 0.
Das Ergebnis erweitert die klassische notwendige Bedingung f ′(p) = 0 für lokale Extrema einer reellen Funktion. Das Verschwinden des Gradienten ist keine hinreichende Bedingung: Das eindimensionale Beispiel f : ℝ → ℝ mit f (x) = x3 und f ′(0) = 0 wird im Mehrdimensionalen ergänzt durch die Sattelfläche f : ℝ2 → ℝ mit f(x, y) = x2 − y2. Hier gilt grad f (0) = 0, aber die Funktion besitzt im Nullpunkt weder ein lokales Maximum noch ein lokales Minimum.
Ein hinreichendes Kriterium für ein striktes lokales Minimum einer reellen Funktion an einer kritischen Stelle p (d. h. f ′(p) = 0) ist, dass f ″(p) > 0. Um ein mehrdimensionales Analogon dieses Kriteriums formulieren zu können, brauchen wir eine mehrdimensionale Version einer „zweiten Ableitung“:
Definition (Hesse-Matrix)
Sei f : P → ℝ zweimal partiell differenzierbar, und sei p ∈ P. Dann ist die Hesse-Matrix Hf(p) von f an der Stelle p definiert durch
Hf(p) = (∂i ∂jf (p))1 ≤ i, j ≤ n.
Die Hesse-Matrix Hf(p) ist eine reelle (n × n)-Matrix, deren Einträge aus allen zweiten partiellen Ableitungen von f an der Stelle p bestehen. Ist f zweimal stetig differenzierbar, so ist die Hesse-Matrix symmetrisch nach dem Satz von Schwarz. In der Analysis zeigt man den folgenden Satz:
Satz (hinreichende Bedingung für ein lokales Extremum)
Sei f : P → ℝ zweimal stetig differenzierbar, und sei p ∈ P mit grad f (p) = 0.
Weiter sei die Hesse-Matrix H = Hf(p) positiv definit, d. h. es gelte
〈 x, H x 〉 > 0 für alle x ∈ ℝn mit x ≠ 0.
Dann ist p eine strikte lokale Minimalstelle von f.
An die Stelle von f ″(p) > 0 tritt also positive Definitheit der Hesse-Matrix H = Hf(p). Um letztere festzustellen, stehen verschiedene Möglichkeiten zur Verfügung. Für den Fall n = 2 sind zum Beispiel äquivalent:
(a) | H ist positiv definit, d. h. 〈 (x, y), H(x, y) 〉 > 0 für alle (x, y) ≠ 0. |
(b) | H(1, 1) = ∂11f (p) > 0 und det(H) = ∂11f (p) ∂22f (p) − (∂12f (p))2 > 0. |
(c) | Alle Eigenwerte von H sind positiv. |
Beispiel
Sei f : ℝ2 → ℝ mit f(x, y) = x2 + y2 − 2x + 2y + 2. Dann gilt
grad f (x, y) = (2x − 2, 2y + 2).
Damit hat f höchstens im Punkt p = (1, −1) ein lokales Extremum. Die Hesse-Matrix Hf(p) = ((2, 0); (0, 2)) ist positiv definit, sodass p eine strikte lokale Minimalstelle von f ist. Dies lässt sich auch geometrisch einsehen, da f(x, y) = (x − 1)2 + (y + 1)2 ein nach oben geöffnetes Paraboloid ist.
Strikte lokale Maximalstellen können wir durch Übergang zu −f untersuchen oder analoge Ergebnisse mit „die Hess-Matrix H ist negativ definit“ formulieren (d. h. 〈 x, H x 〉 < 0 für alle x ∈ ℝn mit x ≠ 0).