Die Ellipsen von Matrix-Potenzen
Sei A = ((a, b), (c, d)) invertierbar. Wir betrachten die Ellipsen
EAn = An[ K ] für alle n ≥ 1
der Potenzen An von A und zeigen, dass ihre Drehwinkel
φn = arg(h1(An)) = arg(q(An))/2 ∈ ] −π/2, π/2 ]
unter guten Voraussetzungen an die Matrix A konvergieren (wobei wir im Kreisfall q(An) = 0 den Winkel φn frei wählen können).
Wir beginnen wieder mit dem symmetrischen Fall. Ist A symmetrisch, so gilt nach dem Spektralsatz
A = S D St mit S = (v; w) orthogonal, D = diag(λ, μ)
Eine einfache Induktion nach n zeigt, dass
An = S Dn St, Dn = diag(λn, μn) für alle n ≥ 1
Damit erhalten wir für jedes n ≥ 1 die Singulärwertzerlegung
An = S diag(|λ|n, |μ|n) Tn, wobei
Tn = diag(sgn(λn), sgn(μn)) St
Die Matrix Tn ist orthogonal als ein Produkt einer ±1-Diagonalmatrix und einer orthogonalen Matrix. Da S unverändert bleibt, sind die Spalten v und w von S Halbachsenrichtungen der Ellipse EAn. Die Vektoren v und w sind orthogonale Eigenvektoren von A zu den Eigenwerten λ, μ. Dies zeigt:
Satz (Ellipsen von symmetrischen Matrix-Potenzen)
Sei A invertierbar und symmetrisch. Dann sind die orthogonalen Eigenvektoren von A die Halbachsenrichtungen von EAn. Die Halbachsen von EAn sind die n-ten Potenzen der Beträge der Eigenwerte von A. Der Kreisfall tritt genau dann ein, wenn die Beträge der Eigenwerte übereinstimmen.
Wir nehmen nun schwächer an, dass A nicht symmetrisch, aber immerhin noch diagonalisierbar ist. Dann gibt es eine Zerlegung
A = P D P−1 mit P = (v; w) nicht orthogonal, D = diag(λ, μ)
Erneut gilt
An = P Dn P−1, Dn = diag(λn, μn) für alle n ≥ 1
Folgende Überlegung suggeriert ein Grenzwertverhalten der Halbachsenrichtungen der Ellipsen EAn:
Heuristik
Wir nehmen an, dass λ > μ > 0. Für große n dominiert λn über μn in Dn. Damit verformt Dn das Bild P−1[ K ] des Einheitskreises unter P−1 zu einer langen schmalen Ellipse, deren große Halbachsenrichtung einen kleinen Winkel mit der x-Achse einschließt, d. h. nahe bei e1 liegt. Durch Anwendung von P wird diese Halbachsenrichtung zu v = P e1 mit der ersten Spalte v von P. Wir erwarten also, dass die großen Halbachsenrichtungen von EAn in den Eigenraum Eig(λ, A) = { α v | α ∈ ℝ } konvergieren. Analoge Überlegungen gelten für den allgemeineren Fall |λ| > |μ| eines (im Betrag) dominanten Eigenwerts λ.
Für ein normiertes u0 ∉ span(w) ist es in der Tat nicht schwer zu zeigen, dass die Vektoriteration (un)n ∈ ℕ mit
un + 1 = A un/∥ A un ∥ für alle n ≥ 0
in den Eigenraum eines dominanten Eigenwerts λ konvergiert. Dieses Verfahren wird in der Numerik zur Berechnung eines dominanten Eigenvektors verwendet (ohne dass λ bekannt ist). In unserem Fall besteht die betrachtete Folge jedoch aus Halbachsenrichtungen, die sich im Allgemeinen nicht durch iterierte Anwendung von A ergeben. Zudem bleibt der Fall |λ| = |μ| zweier betragsgleicher Eigenwerte offen. Wir behandeln die Problemstellung mit den obigen Formeln für die Ellipsen diagonalisierter Matrizen.
Sei also
A = P diag(λ, μ) P−1, P = (v; w), 〈 v, w 〉 ≠ 0, α = arg(v), β = arg(w)
Wir nehmen wieder (a) − (c) an, d. h. es gilt |λ| ≥ |μ| und v, w liegen normiert in der rechten Halbebene. Sei n ≥ 1. Dann gilt mit δ = det(P):
An = P diag(λn, μn) P−1 = 1δ
Der q-Vektor von An berechnet sich nach obigen Ergebnissen zu
(+) qAn = τn (λn v+ − μn w+) wobei τn = (λn − μn)/(2δ2)
Fallunterscheidung nach den Eigenwerten
Der Fall λ = μ kann nicht eintreten (er ist durch den symmetrischen Fall abgedeckt), denn für λ = μ ist A = λ E2 symmetrisch.
1. Fall λ = − μ
Für die geraden Exponenten gilt
qA2n = 0, A2n = λ2n E2, EA2n = K|λ|2n
Für die ungeraden Exponenten erhalten wir mit (+):
A2n + 1 = λ2n + 1 P diag(1, −1) P−1
q(A2n + 1) = τ2n +1 λ2n + 1 (v+ + w+)
Der q-Vektor ist genau dann 0, wenn β = α ± π/2. Dies ist äquivalent zur Symmetrie der Matrix A. Da wir A als unsymmetrisch voraussetzen, ist qA2n+1 ≠ 0 und die Ellipse EA2n + 1 damit echt. Es gilt
arg(q(A2n + 1)) = (2α + 2β)/2 = α + β
φ2n + 1 = arg(q(A2n + 1))/2 = (α + β)/2
Der Drehwinkel ist also für alle ungeraden Exponenten das arithmetische Mittel der Winkel der Eigenvektoren.
2. Fall |λ| > |μ|
Mit η = μ/λ gilt nach (+):
q(An) = τn λn (v+ − ηn w+)
Mit limn ηn = 0 erhalten wir
limn φn = limn arg(v+ − ηn w+)/2 = arg(v+)/2 = arg(v)
Wir fassen zusammen:
Satz (Ellipsen von diagonalisierbaren Matrix-Potenzen, |λ| ≠ |μ|)
Sei A invertierbar und diagonalisierbar mit im Betrag verschiedenen Eigenwerten. Dann konvergieren die großen Halbachsenrichtungen der Ellipsen EAn = An[ K ] in den Eigenraum des dominanten Eigenwerts λ von A. Ist v ein λ-Eigenvektor in der rechten Halbebene, so gilt
limn → ∞ φn = arg(v), wobei
φn = φ(EAn) = arg(qAn)/2 ∈ ] − π/2, π/2 ]
Die Folge der Drehwinkel φn ist genau dann konstant, wenn A symmetrisch ist.
Satz (Ellipsen von diagonalisierbaren Matrix-Potenzen, λ = − μ)
Sei A invertierbar und diagonalisierbar mit Eigenwerten λ, μ mit λ = − μ.
(1) | Ist A symmetrisch, so ist EAn ein Kreis für alle n. |
(2) | Ist A nicht symmetrisch, so ist EAn ein Kreis für gerade n und eine echte Ellipse für ungerade n. Für die Drehwinkel gilt φn = (arg(v) + arg(w))/2 ∈ ] −π/2, π/2 ] für alle ungeraden n, wobei v, w Eigenvektoren zu λ, μ in der rechten Halbebene sind. |
Wir betrachten ein Beispiel für den Fall betragsgleicher Eigenwerte mit unterschiedlichem Vorzeichen.
Beispiel
Sei A = ((1, 0); (−2, −1)). Die Matrix A ist diagonalisierbar mit den Eigenwerten λ = 1 und μ = −1. Zugehörige Eigenvektoren in der rechten Halbebene sind v = e1 und w = (1, 1). Es gilt also
A = P diag(1, −1) P−1 mit P = (v; w) = ((1, 0); (1, 1))
Die Potenzen berechnen sich für alle n ≥ 1 zu
A2n = E2, A2n + 1 = A =
Der q-Vektor berechnet sich aus den Einträgen von A für ungerade Exponenten zu
qA2n + 1 = qA = ((1 + 4 + 0 − 1)/2, 1 · 0 + (−2)(−1)) = (2, 2)
Es gilt arg(q) = π/4, sodass der Drehwinkel von EA (und aller EA2n+1) gleich π/8 ist. Dieser Wert ist, wie es nach dem Satz sein muss, das arithmetische Mittel von arg(v) = 0 und arg(w) = π/4.
Die Konvergenz der Halbachsenrichtungen kann auch im nicht diagonalisierbaren Fall eintreten:
Beispiel
Wir betrachten die Scherung A = ((1, 0); (1, 1)). Die Matrix A ist nicht diagonalisierbar (auch nicht in ℂ), hat aber einen Eigenwert λ = 1 und den zugehörigen Eigenvektor v = (1, 0). Für alle n ≥ 1 gilt:
An = , qAn = (n2/2, n), φn = arctan(2/n)2
Es gilt limn φn = 0 = arg(v).