Substitutionen

 Die Variablensubstitution ist eine Methode zur Umformung (und insbesondere Vereinfachung) von Termen durch die Einführung von neuen Variablen. Die alten und neuen Variablen lassen sich dabei in der Regel wechselweise eindeutig ineinander übersetzen. In der Integrationstheorie spielt die Methode bei der Substitionsregel zur Manipulation eines Integranden eine sehr bedeutsame Rolle. Daneben sind Gleichungen und allgemeiner Gleichungssysteme ein klassisches Anwendungsgebiet.

 Wir diskutieren das Verfahren für einen instruktiven Spezialfall. Sei hierzu eq(x, y) eine als Term vorliegende Gleichung in den reellen Variablen x und y. Dabei steht „eq“ steht für lateinisch „equatio“ oder engl. „equation“. Ein typisches Beispiel ist eq(x, y) = „x2 + y2 = 1“. Weiter sei

L  =  { (x, y)  ∈  2 | eq(x, y) }

die Lösungsmenge der Gleichung. Unser Ziel ist, die Gleichung durch die Einführung neuer Variablen zu vereinfachen und dadurch zu lösen.

Das Verfahren der Variablensubstitution

Erster Schritt: Neue Variable und Bijektionen

Wir schreiben

x′  =  s1(x, y)x  =  s1′(x′, y′)
y′  =  s2(x, y) y  =  s2′(x′, y′)

Dabei sind x′ und y′ neue Variablen und s1, s2, s1′, s2′ Terme in x, y bzw. x′, y′. Diese Substitutionsterme sind frei wählbar, sie müssen aber durch

f(x, y)  =  (s1(x, y), s2(x, y)) für alle (x, y)  ∈  2
f −1(x′, y′)  =  (s1′(x′, y′), s2′(x′, y′)) für alle (x′, y′)  ∈  2

eine Bijektion f : 2  2 und ihre Umkehrfunktion f −1 : 2  2 definieren. Die Wahl geeigneter Terme (gleichwertig: die geeignete Wahl der Bijektion f) ist die Kunst.

Zweiter Schritt: Berechnung einer neuen Gleichung durch Substitution

Wir ersetzen in der Gleichung eq(x, y):

(i)

jede Variable x durch den Term s1′(x′, y′)

(ii)

jede Variable y durch den Term s2′(x′, y′)

Dadurch erhalten wir eine neue Gleichung eq′(x′, y′) in den Variablen x′, y′. Funktional entspricht dies der Anwendung der Umkehrfunktion f −1, da (x, y) = (s1′(x′, y′), s2′(x′, y′)) = f −1(x′, y′).

Dritter Schritt: Berechnung der Lösungsmenge der neuen Gleichung

Wir bestimmen

L′  =  { (x′, y′)  ∈  2 | eq′(x′, y′) }

In der Praxis erfolgt vor der Lösung im Allgemeinen zunächst eine Vereinfachung von eq′(x′, y′) durch Anwendung von Rechenregeln. Manchmal kann auch eine zweite Substitution x″, y″ nötig sein, usw.

Wir können auch L′ = { (x, y) | eq′(x, y) } schreiben, da es nicht auf die Namen der Variablen ankommt. Wichtig ist die Verwendung der neuen Gleichung eq′.

Vierter Schritt: Berechnung von L (Rücksubstitution)

Wir berechnen

L  =  f −1[ L′ ]  =  { f −1(x′, y′) | (x′, y′)  ∈  L′ }

Ist L′ durch eine Eigenschaft in den Variablen x′, y′ beschrieben, so kann dies durch Rücksubstitution erfolgen, indem wir überall x′ durch s1(x, y) und y′ durch s2(x, y) ersetzen.

Korrektheit des Verfahrens

Dass das Substitutionsverfahren korrekt ist, lässt sich so einsehen: Mit

L  =  { (x, y) | eq(x, y) }

gilt für die Bijektion f : 2  2:

f [ L ] =  { f (x, y) | eq(x, y) }
=  { (x′, y′) | eq(f −1(x′, y′)) }
=  { (x′, y′) | eq(s1′(x′, y′), s2′(x′, y′)) }
=  { (x′, y′) | eq′(x′, y′) }  =  L′

Folglich ist

L  =  f −1[ L′ ]

 Das Korrektheitsargument zeigt zudem, dass aus mengentheoretischer Sicht eine Bijektion f : 2  2 betrachtet und zunächst das Bild L′ = f [ L ] der Lösungsmenge unter f berechnet wird (anstelle von L). Die Lösungsmenge L der ursprünglichen Gleichung erhalten wir durch L = f −1[ L′]. In der Praxis ist das Arbeiten mit Variablen und Termen anstelle der Bijektionen f und f −1 oftmals sehr hilfreich und suggestiv. Die Situation lässt sich mit der Substitionsregel der Integration vergleichen, die sich theoretisch mit Substitutionsfunktionen formulieren und beweisen lässt, in der Praxis aber oft mit Hilfe von Variablen und Termen durchgeführt wird (wie etwa x = sin t, t = arcsin x, dx = cos t dt usw).

Beispiel

Wir betrachten die Gleichung

x2 + y2 − 2x + 4y + 4  =  0

Wir setzen

x′  =  x − 1x  =  x′ + 1
y′  =  y + 2y  =  y′ − 2

Die zugehörigen Bijektionen f, f −1 : 2 2 sind definiert durch

f(x, y)  =  (x′, y′)  =  (x − 1, y + 2),  f −1(x′, y′)  =  (x, y)  =  (x′ + 1, y′ − 2)

Durch Substitution erhalten wir die neue Gleichung

(x′ + 1)2  +  (y′ − 2)2  −  2(x′ + 1)  +  4(y′ − 2)  +  4  =  0

in den Variablen x′ und y′. Ausrechnen ergibt

x′2 + 2x′ + 1 + y′2 − 4 y′ + 4 − 2 x′ − 2 + 4 y′ − 8 + 4  =  0

Durch Vereinfachung erhalten wir die äquivalente Gleichung

x′2 + y′2  =  1

Ihre Lösungsmenge

L′  =  { (x′, y′)  ∈  2 | x′2 + y′2  =  1 }

ist der Einheitskreis K1. Durch Rücksubstitution erhalten wir

L  =  { (x, y)  ∈  2 | (x − 1)2 + (y + 2)2  =  1 }

Äquivalent können wir L identifizieren durch

L  =  f −1[ L′ ]  =  tr(1, −2)[ K1 ] (mit der Translation trv um v = (1, −2))

Die Menge L ist der Kreis mit Mittelpunkt (1, −2) und Radius 1.

Bemerkung

Die Lösung lässt sich schneller finden, indem wir die Gleichung

x2 + y2 − 2x + 4y + 4  =  0

in der Form

(x2 − 2x + 1) + (y2 + 4y + 4)  −  1  =  0

schreiben und durch Anwendung der binomischen Formeln in

(x − 1)2 + (y + 2)2  =  1

überführen. Die obige Substitution dient der Erläuterung der Methode.

 Allgemeinere Beispiele (und die Hauptbeispiele für dieses Buch) sind:

Affine Transformationen

Eine affine Transformation f : 2  2 der euklidischen Ebene hat die Form

f (v)  =  A v + v0  für alle v  ∈  2

mit einer invertierbaren Matrix A = ((a, b), (c, d)) und einem Translationsvektor v0 = (x0, y0). Für die Umkehrfunktion f −1 : 2  2 gilt

f −1(v′)  =  A−1(v′ − v0)  für alle v′  ∈  2

Als Substitution notiert schreiben wir:

(x′, y′)  =  A (x, y)  +  (x0, y0)

(x, y)  =  A−1((x′, y′) − (x0, y0))  =  A−1(x′ − x0, y′ − y0)

Mit der Invertierungsformel

A−1  =  δ−1 ((d, −b), (−c, a)),  δ  =  det(A)  =  ad − bc

erhalten wir konkret:

x′  =  a x  +  b y  +  x0x  =  δ−1 (d (x′ − x0)  −  b (y′ − y0))
y′  =  c x  +  d y  +  y0y  =  δ−1 (a (y′ − y0)  −  c (x′ − x0))

Im Gegensatz zum vorangehenden Beispiel hängt hier x′ nicht nur von x, sondern auch von y ab. Analoges gilt für y′.

Mit Hilfe einfacher affiner Transformationen (genauer: mit Hilfe von Rotationen und Translationen) werden wir eine Gleichung

a x2  +  b x y  +  c y2  +  d x  +  e y  +  f  =  0

in eine möglichst einfache Normalform

a′ x′2  +  b′ x′ y′  +  c′ y′2  +  d′ x′  +  e′ y′  +  f ′  =  0

in den Variablen x′ und y′ überführen, in der möglichst viele Koeffizienten a′, …, f ′ null sind (siehe den Abschnitt über Kegelschnitte und ihre Klassifikation). Die Translation des Kreises im obigen Beispiel entspricht dem einfachen Fall A = E2 und v0 = (−1, 2). Durch die Translation erreichen wir d′ = e′ = 0 (mit d = −2 und e = 4).