Mehrdimensionale Taylor-Polynome
Mit unseren neuen Notationen können wir nun Taylor-Polynome für Funktionen mit n-dimensionalen Definitionsbereichen definieren. Die alte Definition kann fast wörtlich übernommen werden!
Definition (mehrdimensionale Taylor-Polynome)
Sei f : P → ℝ, P ⊆ ℝn, ν-mal stetig differenzierbar. Weiter sei p ∈ P.
Dann definieren wir das Taylor-Polynom ν-ter Ordnung von f im Entwicklungspunkt p durch:
Tνp f (x) = ∑k ∈ ℕn, |k| ≤ νf (k)(p)k! (x − p)k für alle x ∈ ℝn.
Die Taylor-Polynome von f sind immer auf dem ganzen Raum ℝn definiert. Die Summe schreiben wir kurz als ∑|k| ≤ ν. Dabei ist die Ordnung ν fest.
Wie früher ist das Taylor-Polynom Tνp f das eindeutige Polynom g vom Grad kleinergleich ν mit ∂(k) g(p) = f (k)(p) für alle k mit |k| ≤ ν (Beweis als Übung).
Bevor wir den Satz von Taylor formulieren, wollen wir die Taylor-Polynome der Ordnungen 0, 1 und 2 etwas genauer betrachten, um ein Gefühl für die Struktur dieser Polynome zu entwickeln.
Das Taylor-Polynom nullter Ordnung
Für ν = 0 gilt für alle x ∈ ℝn:
T0p f (x) = ∑|k| ≤ 0f (k)(p)k! (x − p)k = f (0)(p)0 ! (x − p)0 = f (p),
Damit ist also wie gewohnt das Taylor-Polynom 0-ter Ordnung die Auswertung der Funktion im Entwicklungspunkt.
Das Taylor-Polynom erster Ordnung
Für ν = 1 durchläuft k in der Summe ∑|k| ≤ 1 den Nullvektor und die kanonischen Einheitsvektoren e1 = (1, 0, …, 0), …, en = (0, …, 0, 1) des ℝn. Damit gilt für alle x ∈ ℝn:
T1p f (x) | = T0p f (x) + ∑|k| = 1f (k)(p)k! (x − p)k |
= f (p) + ∑1 ≤ j ≤ n (x − p)ej | |
= f (p) + ∑1 ≤ j ≤ n∂jf (p)1 (x − p)j = f (p) + 〈 grad(f)(p), x − p 〉. |
Der zweite Summand ist das Ergebnis der Multiplikation der Jacobi-Matrix Jf(p) von f im Punkt p mit dem Spaltenvektor x − p. Das Taylor-Polynom erster Ordnung ist also wie gewohnt die Linearisierung der Funktion im Punkt p. Der Leser vergleiche das Ergebnis noch einmal mit dem eindimensionalen Fall:
T1p f (x) = f (p) + f ′(p) (x − p).
Das Taylor-Polynom zweiter Ordnung
Für ν = 2 ist das Taylor-Polynom nun schon wesentlich komplexer. In der Summe ∑|k| ≤ 2 durchläuft k nun zusätzlich alle Summen ei + ej kanonischer Basisvektoren, also die Vektoren
(i) | 2 e1 = (2, 0, …, 0), 2 e2 = (0, 2, 0, …, 0), …, 2 en = (0, …, 0, 2), |
(ii) | ei + ej für alle 1 ≤ i < j ≤ n. |
Die Vektoren des Typs (i) haben genau einen 2-Eintrag, die des Typs (ii) haben genau zwei 1-Einträge. Es gilt:
f (ei + ej) = ∂i, j f = f (ej + ei) | für alle i, j, |
(x − p)ei + ej = (x − p)i (x − p)j | für alle i, j, |
(2 ej) ! = 2 | für alle j, |
(ei + ej) ! = 1 | für alle i ≠ j. |
Damit berechnet sich das Taylor-Polynom zweiter Ordnung zu
T2p f (x) = T1p f (x) + ∑|k| = 2f (k)(p)k! (x − p)k
= T1p f (x) + ∑1 ≤ j ≤ n (x − p)2j + ∑1 ≤ i < j ≤ n ∂i, jf (p) (x − p)i (x − p)j
= f (p) + 〈 grad(f)(p), x − p 〉 + 12 ∑1 ≤ i, j ≤ n ∂i, jf (p) (x − p)i (x − p)j.
In der letzten Form wird für i ≠ j sowohl die Ableitung ∂i∂j f (p) als auch die Ableitung ∂j∂i f (p) betrachtet, was aber durch den Faktor 1/2 und die Vertauschbarkeit ∂i∂j f = ∂j∂i f wieder ausgeglichen wird.
Auch hier zum Vergleich noch einmal die eindimensionale Version:
T2p f (x) = f (p) + f ′(p) (x − p) + 12 f ″(p) (x − p)2.
Der Beitrag der „zweiten Ableitung“ zum Taylor-Polynom ist im Mehrdimensionalen wesentlich komplizierter. Wir können ihn sympathischer und übersichtlicher notieren, wenn wir die Brille der linearen Algebra aufsetzen:
Euklidisches Skalarprodukt mit Matrix
Sei A ∈ ℝ n × n. Dann gilt für alle x, y ∈ ℝn:
〈 x, A y 〉 | = x1 (∑1 ≤ j ≤ n a1 j yj) + … + xn (∑1 ≤ j ≤ n an j yj) |
= ∑1 ≤ j ≤ n a1 j x1 yj + … + ∑1 ≤ j ≤ n an j xn yj | |
= ∑1 ≤ i, j ≤ n ai j xi yj (= ∑1 ≤ i, j ≤ n aj i yi xj = 〈 y, At x 〉 = 〈 At x, y 〉) |
Speziell gilt:
〈 x, A x 〉 | = ∑1 ≤ i, j ≤ n ai j xi xj, |
〈 x, A x 〉 | = ∑1 ≤ i ≤ n ai i xi2 + 2 ∑1 ≤ i < j ≤ n ai j xi xj, falls A symmetrisch. |
Beispiel
Ist A = ((a, b), (c, d)) ∈ ℝ2 × 2, so gilt für alle (x, y) ∈ ℝ2:
〈 (x, y), A (x, y) 〉 | = a x2 + b x y + c y x + d y2 |
= a x2 + (b + c) x y + d y2 |
Für eine symmetrische Matrix A = ((a, b/2), (b/2, c)) erhalten wir
〈 (x, y), A (x, y) 〉 | = a x2 + b x y + c y2. |
Damit ist der dritte Summand
12 ∑1 ≤ i, j ≤ n ∂i, jf (p) (x − p)i (x − p)j
des Taylor-Polynoms zweiter Ordnung von f an der Stelle x − p von der Form
12 〈 x − p, H (x − p) 〉
mit der aus allen Ableitungen ∂i, j f (p) gebildeten reellen (n × n)-Matrix H. Wir definieren:
Definition (Hesse-Matrix)
Sei f : P → ℝ zweimal differenzierbar, und sei p ∈ P. Dann ist die Hesse-Matrix Hf(p) ∈ ℝn × n von f im Punkt p definiert durch
Hf(p) = (∂i ∂jf (p))1 ≤ i, j ≤ n.
Es gilt Jgrad(f)(p) = (∂j grad(f)i (p))i,j = (∂j ∂i f (p))i,j, sodass Hf(p) = Jgrad(f)(p)t. Ist f zweimal stetig differenzierbar, so sind die Matrizen aufgrund des Satzes von Schwarz symmetrisch, sodass in diesem Fall
Hf(p) = Jgrad(f)(p) = .
In der Hauptdiagonale sehen wir den Laplace-Operator:
∆f (p) = ∑1 ≤ j ≤ n ∂2jf (p) = spur(Hf(p))(Spur der Hesse-Matrix von f)
Da die Spur einer (n × n)-Matrix A die Summe ihrer Eigenwerte λ1, …, λn ∈ ℂ ist und eine symmetrische Matrix nur reelle Eigenwerte besitzt, folgt: ∆f (p) ist die Summe der reellen Eigenwerte der Hesse-Matrix von f im Punkt p. Auf die Eigenwerte der Hesse-Matrix kommen wir bei der Diskussion lokaler Extremwerte noch zurück.