Kurs:Numerik I/Konvergenzraten

Aus testwiki
Zur Navigation springen Zur Suche springen

Einleitung - Konvergenzraten

Die Verfahren, die wir bisher im Zusammenhang mit der Lösung linearer Gleichungssysteme und Ausgleichsprobleme vorgestellt haben, bestimmen in endlich vielen Schritten eine Lösung, welche, wenn man exakt rechnen könnte, immer die exakte Lösung des Problems wäre. In der Praxis lassen sich aber viele mathematische Probleme nur mittels eines Iterationsverfahrens näherungsweise lösen.

Iterationsverfahren

d. h. mittels wiederholter Anwendung derselben Rechenvorschriften, wobei in der k-ten Iteration („Wiederholung“), ausgehend von einer Näherung xk, eine neue und möglichst genauere Näherung xk+1 für eine gesuchte Lösung des Problems berechnet wird. Für den Start eines solchen Verfahrens muss man folglich eine Startnäherung x* vorgeben.

Iterationsverfahren würden im allgemeinen, wenn sie nicht nach endlich vielen Schritten abgebrochen würden, eine unendliche Folge (xk) von Iterierten generieren. Aufgabe des Numerikers ist es zu zeigen, dass jede konvergente Teilfolge oder die ganze vom Verfahren erzeugte Folge (xk) für jeden Startpunkt aus einer gewissen Menge gegen eine (ja a priori unbekannte!) Lösung x* des gegebenen Problems konvergiert. In diesem Zusammenhang spricht man von globaler Konvergenz eines Verfahrens, wenn diese Konvergenz für jede Wahl des Startpunktes aus einer wohlbestimmten Menge (z. B. dem ganzen n) gegeben ist, und von lokaler Konvergenz, wenn dies nur für Startpunkte aus einer (im Allgemeinen nicht spezifizierbaren) Umgebung einer Lösung der Fall ist. In der Praxis wird ein Iterationsverfahren natürlich nach einer endlichen Anzahl von Iterationen gestoppt und zwar dann, wenn zum ersten Mal ein Abbruchkriterium erfüllt ist, welches ausreichende Genauigkeit der aktuellen Näherung im Hinblick auf eine Lösung des Problems sicherstellt. Die Angabe eines sinnvollen Abbruchkriteriums kann dabei durchaus ein schwieriges Unterfangen sein.

Für ein gegebenes Verfahren ist neben dem rechnerischen Aufwand, der pro Iteration zu leisten ist, naturgemäß von Interesse, wie schnell es, wenn es nicht abgebrochen würde, gegen eine gesuchte Lösung konvergieren würde und damit, ob im Schnitt nur wenige oder viele Iterationen durchlaufen werden müssen, bis ein gegebenes Abbruchkriterium erfüllt ist. Wir wollen daher als nächstes den Begriff der Konvergenzgeschwindigkeit eines Verfahrens genauer fassen.

Definition 5.1

Sei eine Norm auf dem n und (xk) eine Folge in n mit limkxk=x*.
(i) Die Folge (xk) konvergiert von (mindestens) der Ordnung p>0 (gegen x*n), wenn mit einem k0 und einem C>0
(5.1) xk+1x*Cxkx*p,kk0
gilt, wobei C<1 für p=1 sei. Im Fall p=1 spricht man auch von linearer und im Fall p=2 von quadratischer Konvergenz.
(ii) Die Folge (xk) konvergiert superlinear (gegen x*n), wenn xkx*,kk0 für ein k0 gilt sowie
(5.2) limkxk+1x*xkx*=0.

Die drei wichtigsten Konvergenzraten bei Algorithmen sind lineare, superlineare und quadratische Konvergenz, so dass wir uns im Folgenden nur auf sie beziehen werden.

Die (praktisch irrelevante) Voraussetzung „xkx*,kk0 für ein k0“ bei der Definition der superlinearen Konvergenz kann man vermeiden, indem man diese mit einer Folge (εk) von Zahlen εk0 mit limkεk=0 durch

(5.3) xk+1x*εkxkx*,kk1

für ein k1 definiert. Für limkxk=x* kann man superlineare Konvergenz der Folge (xk) auch durch die Beziehung

xk+1x*=o(xkx*)

ausdrücken und quadratische Konvergenz durch

xk+1x*=𝒪(xkx*2).

Beispiel 5.2

Die Folgen (xk),(yk) und (zk) mit

xk:=1+0.5k,yk:=1+kk,zk:=1+0.52k

konvergieren für k gegen x*=y*=z*:=1. Man errechnet

|xk+1x*||xkx*|=0.5,
|yk+1y*||yky*|=kk(k+1)k+1=1k+1(11+1k)k0(k),
|zk+1z*||zkz*|2=0.52k+1(0.52k)2=1.

Also konvergiert (xk) linear, (yk) superlinear und (zk) quadratisch gegen 1. Die folgende Tabelle demonstriert, was die unterschiedlichen Konvergenzraten praktisch bedeuten.

k123456xk1.5000001.2500001.1250001.0625001.0312500001.015625000yk2.0000001.2500001.0370371.0039061.0003200001.000021434zk1.2500001.0625001.0039061.0000151.0000000001.000000

Quadratische Konvergenz impliziert superlineare Konvergenz und diese wiederum lineare Konvergenz. Denn im Fall quadratischer Konvergenz hat man mit einem C>0 und einem k0

xk+1x*(Cxkx*)xkx*,kk0,

was wegen limkxk=x* die Bedingung (5.3) impliziert. Ist andererseits (5.2) gegeben, dann existiert zu jedem ε(0,1) ein kε, so dass gilt:

(5.4) xk+1x*εxkx*,kkε.

Letztere Beziehung drückt gerade die lineare Konvergenz aus.

Im Fall der superlinearen Konvergenz gilt ja (5.4), d. h. lineare Konvergenz mit einem ε(0,1), so dass man bei der Definition der linearen und superlinearen Konvergenz auf die Voraussetzung limkxk=x* verzichten könnte. Denn die Ungleichung (5.1) impliziert im Fall der linearen Konvergenz

xk+1x*Cxkx*C2xk1x*Ckk0+1xk0x*,kk0

und damit wegen C<1 auch die Konvergenz limkxk=x*. Bei der Definition einer Konvergenzordnung p>1 muss man aber, da dort nicht C<1 gefordert ist, die Konvergenz der Folge (xk) explizit voraussetzen.

Man beachte, dass lineare Konvergenz mit einer Konstanten C1 sehr langsame Konvergenz bedeuten kann.

Beispiel 5.3

Für die gegen 1 konvergierende Folge (xk) mit xk=1+0.99k,k0 gilt

|xk+11|=0.99|xk1|=0.99k+1|x01|=0.99k+1.

Die langsame Konvergenz sei mit der Berechnung einiger Folgenglieder gezeigt:

k10010002000xk1.3660323411.0000431711.000000002

Man hofft also, dass die Konstante C in der Praxis im Fall der linearen Konvergenz 1 ist und im Fall der quadratischen Konvergenz nicht allzu groß wird. In letzterem Fall besagt die Ungleichung (5.1) für C:=1, dass sich für einen Fehler x*xk<1 die Anzahl der korrekten Stellen hinter dem Dezimalpunkt von xk+1 bezüglich x* gegenüber der von xk ungefähr verdoppelt. Denn dann ist

x*xk+1x*xk2,kk0,

so dass man bei einer Genauigkeit von Stellen hinter dem Dezimalpunkt für xk bezüglich der Norm im k-ten Schritt einen Fehler x*xk510(+1) hat und somit im (k+1)-ten Schritt einen Fehler

x*xk25102(+1)=2.510(2+1).

Quadratische Konvergenz ist demnach eine für die Praxis sehr gute Eigenschaft eines Verfahrens und meist die schnellste Konvergenz, die man mit vernünftigen Mitteln erreichen kann.

Es sei jedoch darauf hingewiesen, dass eine gute Konvergenzrate eines Verfahrens alleine nicht dessen Effizienz garantiert. Von einem gegebenen Verfahren ausgehend, kann man ja immer ein noch schnelleres Verfahren erzeugen, indem man mehrere Iterationen des ersten Verfahrens zu einer einzigen zusammenfasst. Neben der Konvergenzgeschwindigkeit eines Verfahrens hat man also bei der Beurteilung eines Verfahrens den numerischen Aufwand pro Iteration und natürlich auch seine Stabilität zu berücksichtigen.

Wir bemerken ferner, dass die Eigenschaften der superlinearen und quadratischen Konvergenz einer Folge (xk) gegen einen Punkt x* im n aufgrund der Äquivalenz aller Normen im n unabhängig von der gewählten Norm sind. Denn die Äquivalenz zweier Normen a und b auf dem n besagt, dass mit zwei Konstanten α0 und β0

αxbxaβxb,xn

gilt, so dass z. B. die Beziehung in (5.3) bezogen auf die Norm a

αxk+1x*bxk+1x*aεkxkx*aβεkxkx*b,kk1

impliziert und damit für die Nullfolge {ηk} mit ηk:=(β/α)εk auch

xk+1x*bηkxkx*b.

Ähnlich garantiert quadratische Konvergenz bezüglich der Norm a auch die quadratische Konvergenz

xk+1x*bCbxkx*b2

bezüglich einer Norm b, wobei die Konstante Cb von der Norm a abhängt. Dagegen muss lineare Konvergenz einer Folge im n bezüglich einer Norm nicht notwendig die lineare Konvergenz hinsichtlich einer anderen Norm auf dem n zur Folge haben. Zwar gilt beispielsweise für jede linear bezüglich a konvergente Folge (xk) auch

xk+1x*bCbxkx*b

mit einer Konstanten Cb für eine Norm b, jedoch nicht notwendig Cb<1. Sprechen wir also von linearer Konvergenz, so müssen wir klarstellen, bezüglich welcher Norm wir dies tun. Wenn nichts Anderes gesagt wird, beziehen wir uns immer auf Konvergenz im Sinne der Euklidischen Norm 2.

Die hier eingeführten Begriffe der linearen, superlinearen und quadratischen Konvergenz werden gelegentlich auch als Q-lineare, Q-superlineare bzw. Q-quadratische Konvergenz bezeichnet, im Unterschied zur R-linearen, R-superlinearen bzw. R-quadratischen Konvergenz (siehe z. B. das Buch von Ortega und Rheinboldt aus dem Jahre 1970). Das „Q“ steht dabei für „Quotient“, da die Konvergenzrate in allen Fällen mittels des Quotienten xk+1x*/xkx* ausgedrückt werden kann (während „R“ für engl. „Root“, also „Wurzel“ steht).

Siehe auch

Seiteninformation

Diese Lernresource können Sie als Wiki2Reveal-Foliensatz darstellen.

Wiki2Reveal

Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Kurs:Numerik I' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.