Kurs:Numerik I/Lösung der Normalengleichung

Aus testwiki
Version vom 9. August 2022, 11:27 Uhr von imported>Bert Niehaus (Siehe auch)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Zur Navigation springen Zur Suche springen

Mehrdimensionale Taylorentwicklung

Für die mehrdimensionale Tailorentwicklung von einer quadratischen Funktion mit dem Vektor x0k als Entwicklungspunkt gilt:

F(x)=F(x0)+F(x0),xx0+12HF(x0)(xx0),xx0

Dabei ist F(x0) der Gradient von F an der Stelle x0 und HF(x0) die Hesse-Matrix von F an der Stelle x0.

Ausgangsfunktion der Ausgleichsrechnung

Im Allgemeinen wurde aus der linearen Ausgleichsrechnung die folgende Gleichung hergeleitet

F(x)=bTb=F(0V)(2ATb)=F(0V)Tx+12((2ATA)HF(0V)x)Tx

Mehrdimensionale Taylorentwicklung

Diese wird nun als mehrdimensionale Taylorentwicklung einer quadratischen Funktion F:k interpretiert.

F(x)=b22=F(0V)2ATb=F(0V),x+12(2ATA)HF(0V)x,x

Rang der Matrix

Wir betrachten nun die obige quadratische Funktion, wobei wir Rang(A)=k voraussetzen. F hat

Normalengleichung

Notwendige Bedingung, dass x*k Minimalpunkt von F ist, ist die Bedingung F(x*)=0 bzw. äquivalent dazu, dass x* die sog. Normalgleichungen

ATAx=ATb (Normalengleichung) 

erfüllt. Nach dem Lemma zur Lösbarkeit der Normalengleichung ist dabei die (von x unabhängige) Matrix 2F(x):=HF(x) positiv definit, so dass die eindeutige Lösung x* der Normalgleichungen auch der einzige (globale) Minimalpunkt von F ist.

Satz - Lösbarkeit der Normalengleichung

Sei An×k mit nk und Rang(A)=k. Dann besitzt das lineare Ausgleichsproblem

minxkbAx2

eine eindeutige Lösung x*k und diese ist eindeutige Lösung des linearen Gleichungssystems

ATAx=ATb.

Bemerkung - Symmetrie der Matrix

Die Matrix ATAk×k ist mit An×k und nk eine symmetrische Matrix, da die Kompomenten bestehen aus den Skalarprodukten der Spaltenvektor ain von A mit:

ATA=(ai,aj)1i,jkk×k

Die Symmetrie des Skalarprodukte x,y=y,x für x,yn liefert die Symmetrie der Matrix.

Bemerkung - Gleichungssystem mit invertierbarer Matrix

Die Invertierbarkeit von Matrizen bzgl. Matrixmultiplation betrachtet auf einem Matrizenraum von quadratischen betrachten bzgl. einer inneren Verknüpfung. An×k und n>k ist nicht quadratisch. Wenn der Rang von A allerdings k, hat ATAk×k auch den Rang k und die Matrix ATAk×k ist invertierbar. Mit der Normalengleichung, A^:=ATAk×k b^:=ATbk gilt für die eindeutige Lösung xk von A^x=b^

x=A^1b^=(ATA)1ATb

Beispiel

Wir betrachten dazu ein Beispiel der Ausgleichsrechnung.

Beispiel - Ausgleichsgerade 1

Wir betrachten den Fall der sog. Ausgleichsgeraden. Wenn die yj (j=1,,n) mit n2 ungefähr auf einer Geraden liegen, macht es Sinn, polynomiale Ansatzfunktionen bis zum Grad 1 zu verwenden. D.h. als Ansatzfunktionen wählt man

v1(t):=1,v2(t):=t

mit k=2.

Beispiel - Ausgleichsgerade - 2

Somit erhält man approximierende Funktion z über

z(x,t):=x1+x2t,t

und die gesuchten optimalen Koeffizienten der Geradengleichung werden durch den Vektor x:=(x1,x2)2 definiert.

Beispiel - Daten zu Zeitpunkten - 3

Als Daten haben wir z.B. wieder Daten yi zum Zeitpunkt ti erhoben, für die nun die Ausgleichsgerade gesucht wird. Dazu definiert man:

b:=(y1,y2,,yn)Tn,d:=(t1,t2,,tn)Tn

und den Spaltenvektor e, dessen Komponenten nur aus 1 besteht mit

e:=(1,1,,1)Tn

Beispiel - Definition der Matrix A - 4

Nun hat An×2 in diesem Fall die Gestalt A=(ed). Da der erste Spaltenvektor e nur als Komponenten die 1 besitzt und die Zeitpunkte in d=(t1,,tn) paarweise verschieden sind, hat die Matrix den Rang 2.

Beispiel - Berechnung der symmetrischen Matrix - 5

Weiter ist dann

ATA=(eTdT)(ed)=(eTeeTdeTddTd),ATb=(eTbdTb).

Da der Rang der Matrix A 2 ist, besitzt auch die symmetrische Matrix ATA2×2 den Rang 2.

Beispiel - Inverse Matrix zur symmetrischen Matrix - 6

Für eine symmetrische invertierbare Matrix B2×2 kann man die Inverse explizit angeben:

B1=(b11b12b12b22)1=1b11b22b122(b22b12b12b11).


Beispiel - Lösung der Normalengleichung - 7

Somit lautet die Lösung der Normalgleichungen ATAx=ATb in diesem Fall

x*:=(ATA)1ATb=1(eTe)(dTd)(eTd)2(dTdeTdeTdeTe)(eTbdTb)


Beispiel - Berechnung der Lösung - 8

Durch algebraische Umformungen erhält man demzufolge

x*=1(eTe)(dTd)(eTd)2((dTd)(eTb)(dTb)(eTd)(eTe)(dTb)(eTd)(eTb)).

Beispiel - Berechnung von Termen in der Lösung - 9

Dabei hat man

eTe=n,eTd=j=1ntj,eTb=j=1nyj,dTd=j=1ntj2,dTb=j=1ntjyj.

Beispiel - Einsetzung von Termen in die Lösung - 10

Durch Einsetzen erhält man:

x*=1n(j=1ntj2)(j=1ntj)2((j=1ntj2)(j=1nyj)(j=1ntjyj)(j=1ntj)n(j=1ntjyj)(j=1ntj)(j=1nyj)).

Beispiel - Berechnung der Ausgleichsgerade für konkrete Wertepaare - 11

Beispielsweise für die n=8 Wertepaare

tj12345678yj1.752.182.633.243.694.164.555.29

Beispiel - Berechnung von Termen in der Lösung - 12

Wendet man die obigen Überlegungen auf die Beispieldaten an, erhält man

j=18tj=36,j=18yj=27.49,j=18tj2=204,j=18tjyj=144.54.

Beispiel - Berechnung von Termen in der Lösung - 13

Über Einsetzung in die Vektordefinition von x* ergibt sich somit

x*=18204362(20427.4936144.548144.543627.49)=(1.203 9290.496 071).

Die Ausgleichsgerade zu den gegebenen Daten lautet folglich

z(x*,t):=1.203 929+0.496 071t,t.

Beispiel - Maximaler Fehler der Lösung - 14

Der maximale relative Fehler der z(x*,tj) bezüglich der yj beträgt

max1j8|yjz(x*,tj)||z(x*,tj)|=0.016 243

bzw. ungefähr 1.6%.

Normalengleichung für höhere k

Für k>2 könnte man die Normalgleichungen (4.10) mittels einer Cholesky-Zerlegung lösen. Diese selbst ist, wie man zeigen kann, numerisch stabil. Leider ist das Ausgleichproblem selbst aber häufig schlecht konditioniert.

Vandermonde-Matrix - Ansatzfunktionen

Man betrachte z. B. die Matrix A, die sog. Vandermonde-Matrix, die man für n=k im Fall der Wahl der Monome (4.6) als Ansatzfunktionen erhält:

A:=(1t1t1k11t2t2k11tktkk1).

Einfluss auf die Konditionszahl

Für t[0,1] unterscheiden sich die Funktionen tr1 und tr bereits für nicht allzu großes r kaum, so dass die r-te und (r+1)-te Spalten in A für solche r nahezu linear abhängig sind. Die oft große Kondition von A geht außerdem noch im Fall n=k bei der Lösung der Normalgleichungen quadratisch ein, denn es gilt:

Lemma - Eigenwerte positiv definiter Matrizen

Sei An×n eine positiv definite Matrix, dann sind alle Eigenwerte positiv.

Beweis

Sei λ ein Eigenwert der Matrix An×n und xn ein beliebiger Eigenvektor. Dann gilt mit x=0V und der positiven Definitheit:

0<Ax,x=λx,x=λx,x>0

Damit ist auch λ>0. q.e.d.

Bemerkung - Normalengleichung - Taylorentwicklung

Durch die Darstellung der Funktion F in der mehrdimensionalen Taylorentwicklung ist 2ATA die Hesse-Matrix. Die k×k-Matrix ATA ist mit Rang(A)=k positiv definit, denn dann müssen alle Eigenwerte von 0 verschieden sein.

Bemerkung - positiv semidefinit

Die k×k-Matrix ATA ist im Allgemeinen nur Rang(A)<k nur positiv semidefinit, denn es gilt für alle xk{0v}:

ATAx,x=(ATAx)Tx=xTATAx=(Ax)TAx=Ax,Ax0

Lemma - Konditionszahl Normalengleichung

Für eine reguläre Matrix Ak×k gilt für die Konditionszahl

cond2(ATA)=(cond2(A))2.

Dabei bezeichnet der Index 2 an der Konditionszahl, dass die Euklidische Norm bzw. l2-Norm verwendet wurde.

Beweis

Nach dem Lemma über Eigenwerte positiv definiter Matrix Bk×k gilt für die Eigenwerte λi:=λi(B)>0 (i=1,,k).

Beweis 1 - Eigenwert der inversen Matrix

Weiter hat wegen

Bxi=λixiB1xi=1λixi

für Eigenvektoren xi zu 1λi (i=1,,k) besitzt.

Beweis 2 - Berechnung der Konditionszahl

Es gilt folglich nach Satz zur Berechnung der Konditionszahl erhält man:

cond2(B)=B2B12=λmaxλmin,
cond(A)=(maxx=1Ax)/(minx=1Ax).

wobei λmax=maxx=1Ax und λmin=minx=1Ax den größten bzw. kleinsten Eigenwert von B bezeichnen.


Beweis 3 - Orthonormalbasis aus Eigenvektoren

Indem man x mittels einer Orthonormalbasis von Eigenvektoren darstellt, kann man ferner die Abschätzungen

λminx22xTBxλmaxx22,xk

beweisen, wobei offenbar Gleichheit in der ersten bzw. zweiten Ungleichung für einen zu λmin bzw. λmax gehörenden Eigenvektor angenommen wird.

Beweis 4 - Orthonormalbasis aus Eigenvektoren

Folglich schließt man

λmin=minx2=1xTBx,λmax=maxx2=1xTBx.

Wendet man diese Ergebnisse auf das Lemma über Eigenwerte positiv definiter Matrizen auf die positiv definite Matrix ATAk×k an,

Beweis 5 - Satz zur Berechnung der Konditionszahl

so erhält man mit dem Satz zur Berechnung der Konditionszahl

cond2(ATA)=λmax(ATA)λmin(ATA)=max\limits x2=1xT(ATA)xmin\limits x2=1xT(ATA)x=max\limits x2=1Ax22min\limits x2=1Ax22=[cond2(A)]2.

q.e.d.

Bemerkung - Cholesky-Zerlegung

Es ist daher große Vorsicht bei Anwendung der Cholesky-Zerlegung für die Lösung der Normalgleichungen geboten. Prinzipiell ist sie nur zu empfehlen, wenn große Residuen bi(Ax)i (i=1,,n) in der Lösung des Ausgleichsproblems zu erwarten sind (s. Deuflhard/Hohmann). Sicherer ist es aber, so vorzugehen, wie es im folgenden Abschnitt beschrieben ist.

Siehe auch

Seiteninformation

Diese Lernresource können Sie als Wiki2Reveal-Foliensatz darstellen.

Wiki2Reveal

Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Kurs:Numerik I' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.