Der Mittelwertsatz
Die Kettenregel erlaubt uns, den eindimensionalen Mittelwertsatz auf reellwertige mehrdimensionale Funktionen zu übertragen. Für a, b ∈ ℝn definieren wir die Strecke von a nach b durch
ab = { a + t (b − a) | t ∈ [ 0, 1 ] },
und wir sagen, dass ein p zwischen a und b liegt, wenn p ∈ ab, p ≠ a, b.
Satz (Mittelwertsatz für reellwertige mehrdimensionale Funktionen)
Sei f : P → ℝ differenzierbar. Seien a ≠ b in P derart, dass ab ⊆ P.
Dann gibt es ein p zwischen a und b mit
f (b) − f (a) = Jf(p) (b − a).
Beweis
Sei h : [ 0, 1 ] → P definiert durch
h(t) = a + t (b − a) für alle t ∈ [ 0, 1 ].
Dann ist g = f ∘ h : [ 0, 1 ] → ℝ differenzierbar. Nach dem eindimensionalen Mittelwertsatz gibt es also ein t ∈ ] 0, 1 [ mit
f (b) − f (a) = g(1) − g(0) = g′(t) · (1 − 0) = g′(t).
Nach der Kettenregel gilt für alle t ∈ ] 0, 1 [:
g′(t) = Jg(t) = Jf ∘ h(t) = Jf(h(t)) · Jh(t) = Jf(h(t)) (b − a),
wobei wir (1 × 1)-Matrizen mit reellen Zahlen identifizieren. Damit ist p = h(t) wie gewünscht.
Der Satz liefert für eine differenzierbare Funktion f : P → ℝm und a, b ∈ P mit ab ⊆ P Stellen p1, …, pm ∈ P mit
f (b) − f (a) = (Jf1(p1)(b − a), …, Jfm(pm)(b − a)).
Im Allgemeinen gibt es aber kein p ∈ P mit f (b) − f (a) = Jf(p) (b − a), man betrachte etwa f : ℝ → ℝ2 mit f (t) = ei t und a = 0, b = 2π.
In Analogie zum Eindimensionalen erhalten wir aus dem Mittelwertsatz:
Korollar (Charakterisierung der konstanten Funktionen)
Sei P ⊆ ℝn zusammenhängend und f : P → ℝm differenzierbar. Dann ist f genau dann konstant, wenn Jf = 0.
Beweis
Ist f konstant, so ist offenbar Jf = 0. Für die andere Implikation sei ohne Einschränkung m = 1. Da P wegzusammenhängend und offen ist, gibt es für alle a, b ∈ P Punkte a0 = a, a1, …, ar = b in P mit akak + 1 ⊆ P für alle k. Wegen Jf = 0 ist dann aber f (ak) = f(ak + 1) für alle k nach dem Mittelwertsatz.
Ebenfalls wie im Eindimensionalen gilt, dass die Beschränktheit der Ableitung die Lipschitz-Stetigkeit der Funktion impliziert. Dabei verwenden wir wieder die Spektralnorm für die Jacobi-Matrizen.
Satz (Schrankensatz, Lipschitz-Stetigkeit bei beschränkter Ableitung)
Sei f : P → ℝm stetig differenzierbar mit P konvex, d. h., es gelte ab ⊆ P für alle a, b ∈ P. Weiter sei L ∈ ℝ mit
∥ Jf(p) ∥ ≤ L für alle p ∈ P.
Dann ist f Lipschitz-stetig mit der Lipschitz-Konstanten L, d. h.,
∥ f (a) − f (b) ∥ ≤ L ∥ a − b ∥ für alle a, b ∈ P.
Beweis
Seien a ≠ b in P, h : [ 0, 1 ] → P ⊆ ℝn, h(t) = a + t (b − a) für alle t, und g = f ∘ h : [ 0, 1 ] → ℝm. Dann gilt nach der Kettenregel für alle t ∈ [ 0, 1 ]:
Jg(t) = Jf(h(t)) Jh(t) = Jf(h(t)) (b − a), also
∥ g′(t) ∥ = ∥ Jf(h(t)) (b − a) ∥ ≤ ∥ Jf(h(t)) ∥ ∥ b − a ∥ ≤ L ∥ b − a ∥.
(Wir können den Definitionsbereich [ 0, 1 ] von h zu ] − ε, 1 + ε [ vergrößern, sodass wir die Kettenregel auch auf t = 0, 1 anwenden können.) Nach Voraussetzung ist g eine stetig differenzierbare Kurve, sodass
∥ f (b) − f (a) ∥ = ∥ g(1) − g(0) ∥ ≤ L(g) = ∫10 ∥ g′(t) ∥ dt ≤ L ∥ b − a ∥.
Statt der Überführung in eine Kurve können wir auch den Mittelwertsatz anwenden. Er liefert für alle 1 ≤ i ≤ m ein pi ∈ P mit
| (f (b) − f (a))i | = | (Jfi(pi) (b − a))i| ≤ ∥ Jf(pi) ∥ ∥ b − a ∥ ≤ L ∥ b − a ∥,
sodass ∥ f (b) − f (a) ∥ ≤ L∥ b − a ∥. Dies zeigt die Lipschitz-Stetigkeit mit einer etwas größeren Konstanten.