Mehrdimensionale Taylor-Polynome

 Mit unseren neuen Notationen können wir nun Taylor-Polynome für Funktionen mit n-dimensionalen Definitionsbereichen definieren. Die alte Definition kann fast wörtlich übernommen werden!

Definition (mehrdimensionale Taylor-Polynome)

Sei f : P  , P ⊆ n, ν-mal stetig differenzierbar. Weiter sei p  ∈  P.

Dann definieren wir das Taylor-Polynom ν-ter Ordnung von f im Entwicklungspunkt p durch:

Tνp f (x)  =  k  ∈  n, |k| ≤ νf (k)(p)k! (x − p)k  für alle x  ∈  n.

 Die Taylor-Polynome von f sind immer auf dem ganzen Raum n definiert. Die Summe schreiben wir kurz als |k| ≤ ν. Dabei ist die Ordnung ν fest.

 Wie früher ist das Taylor-Polynom Tνp f das eindeutige Polynom g vom Grad kleinergleich ν mit ∂(k) g(p) = f (k)(p) für alle k mit |k| ≤ ν (Beweis als Übung).

 Bevor wir den Satz von Taylor formulieren, wollen wir die Taylor-Polynome der Ordnungen 0, 1 und 2 etwas genauer betrachten, um ein Gefühl für die Struktur dieser Polynome zu entwickeln.

Das Taylor-Polynom nullter Ordnung

Für ν = 0 gilt für alle x  ∈  n:

T0p f (x)  =  |k| ≤ 0f (k)(p)k! (x − p)k  =  f (0)(p)0 ! (x − p)0  =  f (p),

Damit ist also wie gewohnt das Taylor-Polynom 0-ter Ordnung die Auswertung der Funktion im Entwicklungspunkt.

Das Taylor-Polynom erster Ordnung

Für ν = 1 durchläuft k in der Summe |k| ≤ 1 den Nullvektor und die kanonischen Einheitsvektoren e1 = (1, 0, …, 0), …, en = (0, …, 0, 1) des n. Damit gilt für alle x  ∈  n:

T1p f (x) =  T0p f (x)  +  |k| = 1f (k)(p)k! (x − p)k
=  f (p)  +  1 ≤ j ≤ nf(ej)(p)ej! (x − p)ej
=  f (p)  +  1 ≤ j ≤ njf (p)1 (x − p)j  =  f (p)  +  〈 grad(f)(p), x − p 〉.

Der zweite Summand ist das Ergebnis der Multiplikation der Jacobi-Matrix Jf(p) von f im Punkt p mit dem Spaltenvektor x − p. Das Taylor-Polynom erster Ordnung ist also wie gewohnt die Linearisierung der Funktion im Punkt p. Der Leser vergleiche das Ergebnis noch einmal mit dem eindimensionalen Fall:

T1p f (x)  =  f (p)  +  f ′(p) (x − p).

Das Taylor-Polynom zweiter Ordnung

Für ν = 2 ist das Taylor-Polynom nun schon wesentlich komplexer. In der Summe |k| ≤ 2 durchläuft k nun zusätzlich alle Summen ei + ej kanonischer Basisvektoren, also die Vektoren

(i)

2 e1  =  (2, 0, …, 0),  2 e2  =  (0, 2, 0, …, 0),  …,  2 en  =  (0, …, 0, 2),

(ii)

ei  +  ej  für alle 1 ≤ i < j ≤ n.

Die Vektoren des Typs (i) haben genau einen 2-Eintrag, die des Typs (ii) haben genau zwei 1-Einträge. Es gilt:

f (ei + ej)  =  ∂i, j f  =  f (ej + ei) für alle i, j, 
(x − p)ei + ej  =  (x − p)i (x − p)j für alle i, j,
(2 ej) !  =  2 für alle j, 
(ei + ej) !  =  1 für alle i ≠ j.

Damit berechnet sich das Taylor-Polynom zweiter Ordnung zu

T2p f (x)  =  T1p f (x)  +  |k| = 2f (k)(p)k! (x − p)k

 =  T1p f (x)  +  1 ≤ j ≤ nj2f(p)2 (x − p)2j  +  1 ≤ i < j ≤ ni, jf (p) (x − p)i (x − p)j

 =  f (p)  +  〈 grad(f)(p), x − p 〉  +  12 1 ≤ i, j ≤ ni, jf (p) (x − p)i (x − p)j.

In der letzten Form wird für i ≠ j sowohl die Ableitung ∂ij f (p) als auch die Ableitung ∂ji f (p) betrachtet, was aber durch den Faktor 1/2 und die Vertauschbarkeit ∂ij f = ∂ji f wieder ausgeglichen wird.

Auch hier zum Vergleich noch einmal die eindimensionale Version:

T2p f (x)  =  f (p)  +  f ′(p) (x − p)  +  12 f ″(p) (x − p)2.

 Der Beitrag der „zweiten Ableitung“ zum Taylor-Polynom ist im Mehrdimensionalen wesentlich komplizierter. Wir können ihn sympathischer und übersichtlicher notieren, wenn wir die Brille der linearen Algebra aufsetzen:

Euklidisches Skalarprodukt mit Matrix

Sei A  ∈   n × n. Dann gilt für alle x, y  ∈  n:

〈 x, A y 〉 =  x1 (1 ≤ j ≤ n a1 j yj)  +  …  +  xn (1 ≤ j ≤ n an j yj)
=  1 ≤ j ≤ n a1 j x1 yj  +  …  +  1 ≤ j ≤ n an j xn yj
=  1 ≤ i, j ≤ n ai j xi yj(=  1 ≤ i, j ≤ n aj i yi xj  =  〈 y, At x 〉  =  〈 At x, y 〉)

Speziell gilt:

〈 x, A x 〉 =  1 ≤ i, j ≤ n ai j xi xj,
〈 x, A x 〉 =  1 ≤ i ≤ n ai i xi2  +  2 1 ≤ i < j ≤ n ai j xi xj,  falls A symmetrisch.
Beispiel

Ist A = ((a, b), (c, d))  ∈  2 × 2, so gilt für alle (x, y)  ∈  2:

〈 (x, y), A (x, y) 〉 =  a x2  +  b x y  +  c y x  +  d y2
=  a x2  +  (b + c) x y  +  d y2

Für eine symmetrische Matrix A = ((a, b/2), (b/2, c)) erhalten wir

〈 (x, y), A (x, y) 〉 =  a x2  +  b x y  +  c y2.

Damit ist der dritte Summand

12 1 ≤ i, j ≤ ni, jf (p) (x − p)i (x − p)j

des Taylor-Polynoms zweiter Ordnung von f an der Stelle x − p von der Form

12 〈 x − p, H (x − p) 〉

mit der aus allen Ableitungen ∂i, j f (p) gebildeten reellen (n × n)-Matrix H. Wir definieren:

Definition (Hesse-Matrix)

Sei f : P   zweimal differenzierbar, und sei p  ∈  P. Dann ist die Hesse-Matrix Hf(p)  ∈  n × n von f im Punkt p definiert durch

Hf(p)  =  (i ∂jf (p))1 ≤ i, j ≤ n.

 Es gilt Jgrad(f)(p) = (∂j grad(f)i (p))i,j = (∂ji f (p))i,j, sodass Hf(p) = Jgrad(f)(p)t. Ist f zweimal stetig differenzierbar, so sind die Matrizen aufgrund des Satzes von Schwarz symmetrisch, sodass in diesem Fall

Hf(p)  =  Jgrad(f)(p)  =  1,1f(p)1,2f(p)1,nf(p)1,2f(p)2,2f(p)2,nf(p)1,nf(p)2,nf(p)n,nf(p).

In der Hauptdiagonale sehen wir den Laplace-Operator:

∆f (p)  =  1 ≤ j ≤ n2jf (p)  =  spur(Hf(p))(Spur der Hesse-Matrix von f)

Da die Spur einer (n × n)-Matrix A die Summe ihrer Eigenwerte λ1, …, λn  ∈   ist und eine symmetrische Matrix nur reelle Eigenwerte besitzt, folgt: ∆f (p) ist die Summe der reellen Eigenwerte der Hesse-Matrix von f im Punkt p. Auf die Eigenwerte der Hesse-Matrix kommen wir bei der Diskussion lokaler Extremwerte noch zurück.