Die Ellipsen von Matrix-Potenzen

 Sei A = ((a, b), (c, d)) invertierbar. Wir betrachten die Ellipsen

EAn  =  An[ K ]  für alle n ≥ 1

der Potenzen An von A und zeigen, dass ihre Drehwinkel

φn  =  arg(h1(An))  =  arg(q(An))/2  ∈  ] −π/2, π/2 ]

unter guten Voraussetzungen an die Matrix A konvergieren (wobei wir im Kreisfall q(An) = 0 den Winkel φn frei wählen können).

 Wir beginnen wieder mit dem symmetrischen Fall. Ist A symmetrisch, so gilt nach dem Spektralsatz

A  =  S D St  mit  S = (v; w) orthogonal,  D = diag(λ, μ)

Eine einfache Induktion nach n zeigt, dass

An  =  S Dn St,  Dn  =  diagn, μn)  für alle n ≥ 1

Damit erhalten wir für jedes n ≥ 1 die Singulärwertzerlegung

An  =  S diag(|λ|n, |μ|n) Tn,  wobei

 Tn  =  diag(sgn(λn), sgn(μn)) St

Die Matrix Tn ist orthogonal als ein Produkt einer ±1-Diagonalmatrix und einer orthogonalen Matrix. Da S unverändert bleibt, sind die Spalten v und w von S Halbachsenrichtungen der Ellipse EAn. Die Vektoren v und w sind orthogonale Eigenvektoren von A zu den Eigenwerten λ, μ. Dies zeigt:

Satz (Ellipsen von symmetrischen Matrix-Potenzen)

Sei A invertierbar und symmetrisch. Dann sind die orthogonalen Eigenvektoren von A die Halbachsenrichtungen von EAn. Die Halbachsen von EAn sind die n-ten Potenzen der Beträge der Eigenwerte von A. Der Kreisfall tritt genau dann ein, wenn die Beträge der Eigenwerte übereinstimmen.

 Wir nehmen nun schwächer an, dass A nicht symmetrisch, aber immerhin noch diagonalisierbar ist. Dann gibt es eine Zerlegung

A  =  P D P−1  mit  P = (v; w) nicht orthogonal,  D = diag(λ, μ)

Erneut gilt

An  =  P Dn P−1,  Dn  =  diagn, μn)  für alle n ≥ 1

Folgende Überlegung suggeriert ein Grenzwertverhalten der Halbachsenrichtungen der Ellipsen EAn:

Heuristik

Wir nehmen an, dass λ > μ > 0. Für große n dominiert λn über μn in Dn. Damit verformt Dn das Bild P−1[ K ] des Einheitskreises unter P−1 zu einer langen schmalen Ellipse, deren große Halbachsenrichtung einen kleinen Winkel mit der x-Achse einschließt, d. h. nahe bei e1 liegt. Durch Anwendung von P wird diese Halbachsenrichtung zu v = P e1 mit der ersten Spalte v von P. Wir erwarten also, dass die großen Halbachsenrichtungen von EAn in den Eigenraum Eig(λ, A) = { α v | α  ∈   } konvergieren. Analoge Überlegungen gelten für den allgemeineren Fall |λ| > |μ| eines (im Betrag) dominanten Eigenwerts λ.

 Für ein normiertes u0  ∉  span(w) ist es in der Tat nicht schwer zu zeigen, dass die Vektoriteration (un)n  ∈   mit

un + 1  =  A un/∥ A un ∥  für alle n ≥ 0

in den Eigenraum eines dominanten Eigenwerts λ konvergiert. Dieses Verfahren wird in der Numerik zur Berechnung eines dominanten Eigenvektors verwendet (ohne dass λ bekannt ist). In unserem Fall besteht die betrachtete Folge jedoch aus Halbachsenrichtungen, die sich im Allgemeinen nicht durch iterierte Anwendung von A ergeben. Zudem bleibt der Fall |λ| = |μ| zweier betragsgleicher Eigenwerte offen. Wir behandeln die Problemstellung mit den obigen Formeln für die Ellipsen diagonalisierter Matrizen.

 Sei also

A  =  P diag(λ, μ) P−1,  P = (v; w),  〈 v, w 〉  ≠  0,  α  =  arg(v),  β  =  arg(w)

Wir nehmen wieder (a) − (c) an, d. h. es gilt |λ| ≥ |μ| und v, w liegen normiert in der rechten Halbebene. Sei n ≥ 1. Dann gilt mit δ = det(P):

An  =  P diagn, μn) P−1  =  1δ λnv1w2μnv2w1(μnλn)v1w1(λnμn)v2w2μnv1w2λnv2w1

Der q-Vektor von An berechnet sich nach obigen Ergebnissen zu

(+)  qAn  =  τn (λn v+ − μn w+)  wobei  τn  =  n − μn)/(2δ2)

Fallunterscheidung nach den Eigenwerten

Der Fall λ = μ kann nicht eintreten (er ist durch den symmetrischen Fall abgedeckt), denn für λ = μ ist A = λ E2 symmetrisch.

1. Fall  λ = − μ

Für die geraden Exponenten gilt

qA2n  =  0,  A2n  =  λ2n E2,  EA2n  =  K|λ|2n

Für die ungeraden Exponenten erhalten wir mit (+):

A2n + 1  =  λ2n + 1 P diag(1, −1) P−1

q(A2n + 1)  =  τ2n +1 λ2n + 1 (v+ + w+)

Der q-Vektor ist genau dann 0, wenn β = α ± π/2. Dies ist äquivalent zur Symmetrie der Matrix A. Da wir A als unsymmetrisch voraussetzen, ist qA2n+1 ≠ 0 und die Ellipse EA2n + 1 damit echt. Es gilt

arg(q(A2n + 1))  =  (2α + 2β)/2  =  α + β

φ2n + 1  =  arg(q(A2n + 1))/2  =  (α + β)/2

Der Drehwinkel ist also für alle ungeraden Exponenten das arithmetische Mittel der Winkel der Eigenvektoren.

2. Fall  |λ| > |μ|

Mit η = μ/λ gilt nach (+):

q(An)  =  τn λn (v+ − ηn w+)

Mit limn ηn = 0 erhalten wir

limn φn  =  limn arg(v+ − ηn w+)/2  =  arg(v+)/2  =  arg(v)

 Wir fassen zusammen:

Satz (Ellipsen von diagonalisierbaren Matrix-Potenzen, |λ| ≠ |μ|)

Sei A invertierbar und diagonalisierbar mit im Betrag verschiedenen Eigenwerten. Dann konvergieren die großen Halbachsenrichtungen der Ellipsen EAn = An[ K ] in den Eigenraum des dominanten Eigenwerts λ von A. Ist v ein λ-Eigenvektor in der rechten Halbebene, so gilt

lim ∞ φn  =  arg(v),  wobei

φn  =  φ(EAn)  =  arg(qAn)/2  ∈  ] − π/2, π/2 ]

Die Folge der Drehwinkel φn ist genau dann konstant, wenn A symmetrisch ist.

Satz (Ellipsen von diagonalisierbaren Matrix-Potenzen, λ = − μ)

Sei A invertierbar und diagonalisierbar mit Eigenwerten λ, μ mit λ = − μ.

(1)

Ist A symmetrisch, so ist EAn ein Kreis für alle n.

(2)

Ist A nicht symmetrisch, so ist EAn ein Kreis für gerade n und eine echte Ellipse für ungerade n. Für die Drehwinkel gilt

φn  =  (arg(v) + arg(w))/2  ∈  ] −π/2, π/2 ]  für alle ungeraden n,

wobei v, w Eigenvektoren zu λ, μ in der rechten Halbebene sind.

 Wir betrachten ein Beispiel für den Fall betragsgleicher Eigenwerte mit unterschiedlichem Vorzeichen.

Beispiel

Sei A = ((1, 0); (−2, −1)). Die Matrix A ist diagonalisierbar mit den Eigenwerten λ = 1 und μ = −1. Zugehörige Eigenvektoren in der rechten Halbebene sind v = e1 und w = (1, 1). Es gilt also

A  =  P diag(1, −1) P−1  mit  P = (v; w) = ((1, 0); (1, 1))

Die Potenzen berechnen sich für alle n ≥ 1 zu

A2n  =  E2,  A2n + 1  =  A  =  1201

Der q-Vektor berechnet sich aus den Einträgen von A für ungerade Exponenten zu

qA2n + 1  =  qA  =  ((1 + 4 + 0 − 1)/2,  1 · 0  +  (−2)(−1))  =  (2, 2)

Es gilt arg(q) = π/4, sodass der Drehwinkel von EA (und aller EA2n+1) gleich π/8 ist. Dieser Wert ist, wie es nach dem Satz sein muss, das arithmetische Mittel von arg(v) = 0 und arg(w) = π/4.

 Die Konvergenz der Halbachsenrichtungen kann auch im nicht diagonalisierbaren Fall eintreten:

Beispiel

Wir betrachten die Scherung A = ((1, 0); (1, 1)). Die Matrix A ist nicht diagonalisierbar (auch nicht in ), hat aber einen Eigenwert λ = 1 und den zugehörigen Eigenvektor v = (1, 0). Für alle n ≥ 1 gilt:

An  =  1n01,  qAn  =  (n2/2, n),  φn  =  arctan(2/n)2

Es gilt limn φn = 0 = arg(v).