Nullstellensuche

Wir haben gesehen, dass viele Anwendungen der Differentialrechnung die Bestimmung von Nullstellen erfordern. In expliziter Form ist dies nur für sehr einfache Funktionen möglich. Bereits für Polynome fünften Grades existiert keine allgemeine Lösungsformel. Wir müssen uns also in vielen Fällen mit Näherungsverfahren begnügen. Ist f : P → ℝ eine Funktion mit mindestens einer Nullstelle, so produziert ein derartiges Verfahren ausgehend von einem Startwert x₀  ∈  P eine Folge x₀, x₁, x₂, …, x_n, … von Elementen von P, die gegen eine Nullstelle der Funktion konvergiert, d. h. es gilt f (x*) = 0 für x* = lim_n x_n. Gute Verfahren konvergieren zudem schnell, d. h. die Abstände |x* − x_n| zwischen der Nullstelle und den Approximationen x_n konvergieren schnell gegen 0.

Ein Verfahren, das ganz ohne Methoden der Differentialrechnung auskommt, beruht auf dem Zwischenwertsatz:

Satz (Zwischenwertsatz)

Sei f : [ a, b ] → ℝ eine stetige Funktion. Dann nimmt f jeden Wert zwischen f (a) und f (b) an. Insbesondere besitzt f eine Nullstelle, wenn f (a) und f (b) verschiedene Vorzeichen haben.

Ist f : [ a, b ] → ℝ mit sgn(f (a)) ≠ sgn(f (b)), so liefert das folgende Verfahren eine Nullstelle von f. Zudem lässt es sich als konstruktiver Beweis des Zwischenwertsatzes lesen.

Bisektionsverfahren

Sei f : [ a, b ] → ℝ stetig mit sgn(f (a)) ≠ sgn(f (b)) und f (a), f (b) ≠ 0. Wir setzen (x₀, y₀) = (a, b). Nun definieren wir rekursiv x_n, y_n, c_n wie folgt:

Ist (x_n, y_n) konstruiert, so setzen wir c_n = (x_n + y_n)/2. Ist f (c_n) = 0, so stoppen wir mit Ausgabe von c_n. Andernfalls setzen wir

$(x_{n + 1}, y_{n + 1}) = { \begin{matrix} (x_{n}, c_{n}) & falls sgn (f (x_{n})) \neq sgn (f (c_{n})) \\ (c_{n}, y_{n}) & falls sgn (f (c_{n})) \neq sgn (f (y_{n})) . \end{matrix}$

In jedem Schritt halbieren wir also das betrachtete Intervall unter Wahrung der „guten Voraussetzung“ der unterschiedlichen Vorzeichen. Das Verfahren stoppt mit einer Nullstelle c_n = (x_n + y_n)/2 von f oder es produziert eine Folge (x_n, y_n) mit

lim_n x_n = lim_n y_n = lim_n c_n = x* und f (x*) = 0.

Der Beweis von f (x*) = 0 benutzt die Stetigkeit von f: Die Funktionswerte f (x_n) haben alle das gleiche Vorzeichen s₁, die Funktionswerte f (y_n) alle das gleiche Vorzeichen s₂. Nach Konstruktion gilt s₁ ≠ s₂. Sei s₁ = −1 und s₂ = 1. Aus Stetigkeitsgründen gilt f (x*) = lim_n f (x_n) ≤ 0 und f (x*) = lim_n f (y_n) ≥ 0, sodass f (x*) = 0. Analoges gilt, wenn s₁ = 1 und s₂ = −1.

Die ersten Stellen c₀, c₁, c₂, … eines Bisektionsverfahrens

Ein ganz anderes Verfahren − das berühmte Newton-Verfahren − der Nullstellensuche ergibt sich aus dem folgenden anschaulichen Satz:

Satz (Nullstellensatz für konvexe Funktionen)

Sei f : [ a, b ] → ℝ differenzierbar und streng konvex mit f (a) < 0 < f (b). Dann gilt:

(a)	f besitzt eine eindeutige Nullstelle x*.

(b)	f < 0 auf [ a, x* [ , f > 0 auf ] x, b ], f ′ > 0 auf [ x, b ].

Eine analoge Aussage gilt für den Fall f (a) > 0 > f (b).

Das Newton-Verfahren findet die Nullstelle x* durch wiederholtes Anlegen von Tangenten. Ist x₀ > x*, so liegt die Tangente

g(x) = f (x₀) + f ′(x₀) (x − x₀)

von f an der Stelle x₀ aufgrund der Konvexität von f unterhalb von f. Sie schneidet die x-Achse an der Stelle

x₁ = x₀ − ^f (x₀)_{f ′(x₁)}.

Es gilt x* < x₁ < x₀, sodass x₁ näher an x* liegt als x₀. Diese Beobachtung motiviert:

Newton-Verfahren

Sei f : [ a, b ] → ℝ differenzierbar und streng konvex mit sgn(f (a)) ≠ sgn(f (b)). Wir setzen

$x_{0} = { \begin{matrix} b & falls f (a) < 0 < f (b) \\ a & falls f (b) < 0 < f (a) . \end{matrix}$

Nun definieren wir x_n rekursiv durch

x_n + 1 = x_n − ^f (x_n)_{f ′(x_n)} für alle n ≥ 0.

Die ersten Stellen einer Newton-Iteration x₀, x₁, x₂, …

Die Folge x₀, x₁, x₂, … wird auch als Newton-Iteration von f (zum Startwert x₀) bezeichnet. Man kann wie erwartet zeigen, dass sie im Fall x₀ = b streng monoton fallend und im Fall x₀ = a streng monoton steigend gegen die eindeutige Nullstelle x* von f konvergiert.

Analoge Ergebnisse gelten für streng konkave Funktionen. Durch Übergang von f zu −f können wir aber immer Konvexität erreichen, ohne die Nullstelle zu verändern.

Das Newton-Verfahren eignet sich insbesondere zur Berechnung von Wurzeln. Seien also k ≥ 1 und c > 0. Wir berechnen x* = ^k $\sqrt{c}$ . Hierzu wählen wir ein beliebiges b mit b > x*, etwa b = max(2, c). Dann ist x* die eindeutige Nullstelle der streng konvexen Funktion f : [ 0, b ] → ℝ mit

f (x) = x^k − c für alle x  ∈  [ 0, b ].

Die Newton-Iteration von f zum Startwert x₀ = b ist gegeben durch

x_n + 1 = x_n − $\frac{x_{n}^{k} - c}{k x_{n}^{k - 1}}$ für alle n ≥ 0.

Es gilt x* = lim_n x_n. Speziell können wir eine Quadratwurzel x* = $\sqrt{c}$ mit einem beliebigen Startwert x₀ > x* approximativ durch

x_n + 1 = x_n − $\frac{x_{n}^{2} - c}{2 x_{n}}$ = ^{x_n + c/x_n}₂ für alle n ≥ 0

berechnen. Diese lange vor Newton bekannte Rekursion ist auch als Heron-Verfahren bekannt.

Ein Vergleich der beiden Verfahren

Wir berechnen

$\sqrt{2}$ = 1, 41421 35623 73095 04880 16887 24209 …

mit Hilfe des Bisektions- und des Newton-Verfahrens. Wir verwenden wieder die Funktion f : [ 0, 2 ] → ℝ mit

f (x) = x² − 2.

Die beiden folgenden Tabellen zeigen die ersten Approximationen. Auf einen Kommentar dürfen wir verzichten…

Bisektionsverfahren zur Berechnung von $\sqrt{2}$
n	c_n als Bruch	c_n numerisch
0	1	1
1	³₂	1,5
2	⁵₄	1,25
3	¹¹₈	1,375
4	²³₁₆	1,4375
5	⁴⁵₃₂	1,40625

Newton/Heron-Verfahren zur Berechnung von $\sqrt{2}$
n	x_n als Bruch	x_n numerisch
0	2	2
1	³₂	1,5
2	¹⁷₁₂	1, 41666 …
3	⁵⁷⁷₄₀₈	1, 41421 56862 …
4	⁶⁶⁵⁸⁵⁷₄₇₀₈₃₂	1, 41421 35623 74689 …
5	^886731088897_627013566048	1, 41421 35623 73095 04880 16896 …