Kurs:Numerik I/Lineare Ausgleichsrechnung

Aus testwiki
Zur Navigation springen Zur Suche springen

Einleitung

Diese Seite kann als Wiki2Reveal Folien angezeigt werden. Einzelne Abschnitte werden als Folien betrachtet und Änderungen an den Folien wirken sich sofort auf den Inhalt der Folien aus.

Notation

Um die 0𝕂 aus dem verwendeten Körper von dem Nullvektor 0VV aus dem Vektorraum V zu unterscheiden, wird bei der Verwendung des Nullvektors 0V mit V indiziert.

Problemstellung

In der Praxis hat man häufig auch ein überbestimmtes lineares Gleichungssystem Ax=b für eine Matrix An×k mit n>k und eine rechte Seite bn zu „lösen“. Da ein solches System mehr Gleichungen als Unbekannte hat, ist im Allgemeinen Axb0 für alle xk und besitzt es somit keine exakte Lösung.

Vorgehen - Minimierung des Fehlers

Es macht also Sinn, ein x* als „Lösung“ zu akzeptieren, für welches der Defekt Axb hinsichtlich einer gewählten lp-Norm p auf dem k minimal wird, also eine Lösung x* des Problems

infxkbAxp.

Euklidische Norm - Minimierung des Fehlers 1

Im Fall der Verwendung der l2- bzw. Euklidischen Norm lautet dieses Problem

infxkbAx2,

Im Hinblick auf eine Lösung kann man auch ein äquivalentes Problem bearbeiten, indem man den zu minimierende Ausdruck quadriert:

infxkbAx22

Euklidische Norm - Minimierung des Fehlers 2

Die Äquivalenz ergibt sich aus der strengen Monotonie von f(x)=x2 für x0 und der Eigenschaft der Norm, die einen nicht-negativen Wert liefert. Die Funktionen E2(x):=bAx2 und E(x):=bAx22 haben offenbar dieselben Minimalpunkte x, sofern solche existieren.

Euklidische Norm - Differenzierbarkeit 3

Ferner ist die minimierende Funktion E(x):=bAx22 für alle xk differenzierbar.


Euklidische Norm - Fehlerquadratmethode 4

Bei Wahl der l2-Norm minimiert man also die Summe der Fehlerquadrate, und man spricht daher auch von Fehlerquadratmethode oder von diskreter l2-Approximation.

Nicht-differenzierbare Fehlerfunktionen 5

Die Lösung des entsprechenden Problems für die l1- und die l- bzw. Tschebyscheff-Norm ist ebenfalls von großem praktischen Interesse, führt aber auf nichtdifferenzierbare Funktionen E1(x):=bAx1 bzw. E(x):=bAx, so dass diese Probleme schwieriger zu lösen sind. (Man kann letztere Probleme als lineare Optimierungsprobleme formulieren und beispielsweise mit dem sog. Simplexalgorithmus lösen.

Bemerkung - Euklidische Norm - Fehlerquadratmethode 6

Bevor wir nun das Problem für E(x):=bAx22 weiter untersuchen, wollen wir zunächst zwei Aufgabenstellungen beschreiben und analysieren, die auf ein derartiges über-bestimmtes Gleichungssystem führen.

Anwendung in Naturwissenschaft und Technik

In Naturwissenschaft und Technik hat man oft das Problem, mit einer großen Zahl von Messwerten umgehen zu müssen. Ein anderes, sich häufig stellendes Problem ist es, eine in endlich vielen Punkten gegebene Funktion, welche durch eine rechenaufwändige Vorschrift bestimmt ist, durch eine einfacher zu berechnende zu ersetzen. Beide Probleme kann man gemeinsam angehen und als l2-Approximationsprobleme beschreiben.

Daten und Messwerte

Wir gehen dazu von n Zahlenpaaren

(tj,yj),j=1,,n

mit trts für rs aus, wobei üblicherweise n groß ist. Beispielsweise können die yj irgendwelche zu unterschiedlichen Zeitpunkten tj gemessene Werte oder, im Hinblick auf die Approximation einer gegebenen Funktion f, die Funktionswerte yj:=f(tj) zu gewissen Zeitpunkten tj des Definitionsbereichs von f sein.


Ziel der Ausgleichsrechnung 1

Das Ziel der Ausgleichsrechnung ist es nun, durch geeignete Wahl eines Parametervektors x:=(x1,,xk)Tk eine Funktion der Gestalt

z(x,t):=x1v1(t)+x2v2(t)++xkvk(t),t

mit k gegebenen stetigen Ansatzfunktionen vi zu finden, so dass die Fehlerquadrate

(yjz(x,tj))2,j=1,,n

möglichst klein ausfallen.

Ziel der Ausgleichsrechnung 2

Dabei sollte sinnvollerweise kn sein und ist zumeist kn. Hat man einen solchen Parametervektor x bzw. eine solche Funktion z(x,) gefunden und sind die Approximationsfehler in (4.5) nicht zu groß, so kann man statt mit den Daten (4.3) nur mit dieser Funktion arbeiten, für die im Fall kn erheblich weniger Information, nämlich nur der Vektor x, abgespeichert werden muss. Weil z(x,) eine stetige Funktion ist, erlaubt ein solches Vorgehen außerdem, Werte y zu Werten bzw. „Zeiten“ t zu berechnen, für die keine Messung vorliegt.

Polynomapproximation mit Monomen

Die Ansatzfunktionen hat man so zu wählen, dass sie den gemessenen Prozess möglichst gut beschreiben. Häufig, insbesondere dann, wenn man wenig über den gegebenen Prozess weiß, verwendet man die Monome

vi(t):=ti1(i=1,,k)

so dass

z(x,t):=x1+x2t++xktk1,t

ein Polynom vom Grad k1 ist (Polynomapproximation).

Approximation periodische Prozesse

Wenn es sich um einen periodischen Prozess handelt, ist es aber beispielsweise günstiger, die k:=2p+1 Funktionen

v1(t)=1v2(t)=sin(t),v3(t)=cos(t)v4(t)=sin(2t),v5(t)=cos(2t)=vk(t)=sin(pt),vk+1(t)=cos(pt)

als Ansatzfunktionen zu wählen (trigonometrische Approximation), weil man dann im Allgemeinen bei gleicher Anzahl von Funktionen kleinere Fehler erhält.

Bemerkung - weitere Approximationen

Andere Systeme von Ansatzfunktionen können ebenfalls vernünftig sein. Die Wahl der Ansatzfunktionen hängt von dem Wissen über das modellierte System ab.

Summation von Fehlern bei der Approximation

Nun ist es nicht sinnvoll, x so zu wählen, dass die Summe aller Fehler

yjz(x,tj),j=1,,n

möglichst klein wird, da diese Summe auch bei großen Einzelfehlern sehr klein werden kann, nämlich dann, wenn sich die positiven und negativen Fehler (nahezu) aufheben.

Beispiel Summation von Fehlern bei der Approximation

Nehmen wir als Beispiel y1=100, y2=97 und z(x,t1)=3, z(x,t2)=1. Berechnet man die Fehlersumme, ergibt sich:

(y1z(x,t1))=2100=98+(y2z(x,t2))=1(97)=98=0

Der aggregierte Fehler "suggeriert", dass es keine Abweichung von den gemessenen Werten zu den approximierten Werten gibt, obwohl die Einzelfehler in den beide Messdaten betragsmäßig jeweils um 98 abweichen.

Summation von Fehlerquadraten bei der Approximation

Die Größe des Fehlervektors (yjz(x,tj))j=1,,n misst man daher mit einer lp-Norm im n. Insbesondere führt dann die Verwendung der quadrierten l2- bzw. Euklidischen Norm (siehe den Kommentar auf die für alle xk differenzierbare Funktion

F~(x):=j=1n(yjz(x,tj))2.

Von den Ansatzfunktionen zur Matrix

Mit folgenden Setzungen erhält man ein lineare Gleichungssystem Ax=b.

b:=(y1yjyn),A:=(v1(t1)vk(t1)v1(tj)vk(tj)v1(tn)vk(tn)).

Dabei sucht man geeignete xn, die den Fehler minimieren.

Summe der Fehlerquadrate und Normen

Damit kann eine Fehlerfunktion wie folgt geschrieben werden:

F~(x):=j=1n(yjz(x,tj))2=j=1n(bj(Ax)j)2=bAx22.

Das beschriebene Problem der Ausgleichsrechnung ist also von der Form

infxnbAx22,

wobei A und b durch Messdaten (tj,yj)2 gegeben sind.

Problem der Ausgleichsrechnung

Wir betrachten nun allgemein das Problem einer zu minimierende (Fehler-)Funktion

F(x):=bAx22=bAx,bAx=(bAx)T(bAx).

Bemerkung: Euklidische Skalarprodukt und Matrixmultiplikation

Für x,yn kann man das Euklische Skalarprodukt auch als Matrizenprodukt darstellen, indem man x,yn als Spaltenvektoren auffasst:

x,y=xTy=i=1nxiyi

Anwendung auf die Fehlerfunktion - Matrixrechenregeln

Über Matrixrechenregeln erhält man:

F(x)=(bAx)T(bAx)=bTb(Ax)TbbTAx+(Ax)TAx=xTATAx

als quadratische Funktion in k Veränderlichen x=(x1,,xk)T

F(x)=12xT(2ATA)x(2ATb)Tx+bTb

schreiben. Für die darin vorkommende Matrix ATA kann man aussagen:

Anwendung auf die Fehlerfunktion - Skalarprodukt

Über die Verwendung, dass das Skalarprodukt eine symmetrische Bilinearform ist, erhält man:

F(x)=bAx,bAx=b22Ax,b=b,Axb,Ax+Ax22=x,ATAx=b222b,Ax+Ax22=12x,2ATAx

als quadratische Funktion in k Veränderlichen x=(x1,,xk)T

F(x)=12x,(2ATA)x2ATb,x+b22

schreiben. Für die darin vorkommende Matrix ATA kann man aussagen:

Lemma - Positiv Definitheit - Rang - symmetrische Matrizen

Sei An×k mit nk und Rang(A)=k. Dann ist die Matrix ATAk×k positiv definit.

Beweis

Die Matrix ATA ist wegen (ATA)T=ATA symmetrisch. Weiter ist sie positiv semidefinit, d. h. es gilt

hT(ATA)h=(Ah)T(Ah)=Ah220,hk.

Wegen Rang(A)=k sind die k Spalten a1,,ak von A linear unabhängig (Zeilenrang = Spaltenrang) und daher hat man

hT(ATA)h=0Ah2=0Ah=0h=0.

q.e.d.

Bemerkung - Rangbedingung

Im Fall der Ausgleichsrechnung mit den polynomialen oder trigonometrischen Ansatzfunktionen ist die Rangbedingung in dem Lemma zur positiv Definitheit von symmetrische Matrizen unter unserer Voraussetzung nk immer erfüllt. Dies besagt das folgenden das folgende Lemma.

Lemma - Rangbedingungen polynomiale/trigonometrische Ansatzfunktionen

Für polynomiale oder trigonometrische Ansatzfunktionen besitzt die gebildete Matrix An×k mit

A:=(v1(t1)vk(t1)v1(tj)vk(tj)v1(tn)vk(tn)).

und nk den Rang(A)=k.

Beweis - Rangbedingungen polynomiale/trigonometrische Ansatzfunktionen

Für das oben angegebene A und h:=(h1,,hk)Tk gilt:

Ah=0i=1khivi(tj)=0(j=1,,n).

Beweis 1 - polynomial Ansatzfunktionen

Wird A insbesondere durch polynomiale Ansatzfunktionen spezifiziert, so implizieren wegen nk die Gleichungen i=1khivi(tj)=0, dass ein von Null verschiedenes Polynom vom Grad k1 dann k verschiedene Nullstellen.

Beweis 2 - Fundamentalsatz der Algebra

Nach dem Fundamentalsatz der Algebra kann ein solches Polynom aber höchstens k1 Nullstellen besitzen.

Beweis 3 - trigonometrische Ansatzfunktionen

Für trigonometrische Ansatzfunktionen schließt man analog mittels komplexer Darstellungen des Sinus und Kosinus (siehe z. B. Collatz/Krabs: Approximationstheorie, Teubner, Stuttgart, 1973[1]).

q.e.d.


Siehe auch

Quellennachweis

  1. Collatz/Krabs (1973) Approximationstheorie, Teubner, Stuttgart

Seiteninformation

Diese Lernresource können Sie als Wiki2Reveal-Foliensatz darstellen.

Wiki2Reveal

Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Kurs:Numerik I' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.