Kurs:Lineare Algebra I/Normalform von Operatoren, Diagonalisierbarkeit

Aus testwiki
Version vom 11. Januar 2014, 02:14 Uhr von 84.118.205.71 (Diskussion) (Definition 5.6)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Zur Navigation springen Zur Suche springen

Unter einer Normalform verstehen wir in der linearen Algebra in der Regel eine möglichst einfache (und weitestgehend eindeutige) Form der Matrixdarstellung eines Objektes. Was konkret unter ’einer einfachen Form’ zu verstehen ist, gehört meist zur Fragestellung dazu. Oft gibt man sich eine Form vor und fragt, welche Objekte oder ob alle Objekte in dieser Form dargestellt werden können.

Beispiel: Normalform einer linearen Abbildung.

Zu LHom(V,W), dim(V)=n und dim(W)=m, gibt es Basen B von V und C von W, so dass

MCB(L)=(𝔼r000), r=dim(im(L)).

Dieses Beispiel gilt natürlich auch für den Fall (V=W). Solche linearen Abbildungen L:VV werden Endomorphismen oder Operatoren genannt. Diese sollen näher untersucht werden. Allerdings ist es hier nicht sinnvoll, zwei verschiedene Basen gleichzeitig in einem Vektorraum zu betrachten. Deshalb formulieren wir das Normalformproblem für Operatoren (eines endlich erzeugten Vektorraumes):

Auf welche Form kann die Matrixdarstellung MBB(L) eines Operators LHom(V;V) bei geeigneter Basiswahl gebracht werden?

In der Sprache der Matrizen bedeutet dies: Zu einer quadratischen Matrix AMat(n,n;K) suchen wir eine reguläre Matrix CGln, so dass C1AC eine einfache Gestalt hat. Diese Relation zwischen den Matrizen trägt einen Namen:

Definition 5.1

Zwei quadratische Matrizen A,AMat(n,n;K) heißen konjugiert, falls A=C1AC und CGln(K).

Die Konjugiertheit ist eine Äquivalenzrelation auf der Menge der quadratischen Matrizen. Insbesondere zerfällt Mat(n,n;K) in eine disjunkte Vereinigung von Äquivalenzklassen (hier Konjugationsklassen genannt), deren Elemente jeweils die verschiedenen Matrixdarstellungen eines Operators sind. Das Finden einer Normalform bedeutet hier, aus jeder Konjugationsklasse einen eindeutig bestimmten Vertreter (zumindest eindeutig bis auf endlich viele z.B. Umordnungen) einer bestimmten Gestalt zu finden. Es gibt verschiedene Antworten auf das Normalformproblem für Operatoren. Im Unterschied zu dem obigen Beispiel wird die Antwort auch vom Körper K anhängen bzw. werden einige Normalformen nur für bestimmte Operatoren existieren. Zunächst werden wir nur die einfachen Fälle behandeln: Diagonalform und Dreiecksform (Schur-Normalform). Im nächsten Semester werden wir eine vollständige Antwort in den Varianten der Jordan-Normalform kennenlernen.

Eigenvektoren und Eigenwerte

Stets sei LHom(V,V) ein Operator (lineare Abbildung) und V ein n-dimensionaler K-Vektorraum. Alle Begriffe und Aussagen des folgenden Abschnittes können ebenso gut für quadratische Matrizen AMat(n,n;K) formuliert werden, indem wir A als Operator LA:xAx auf Kn auffassen.

Definition 5.2

λK heißt Eigenwert eines Operators L, falls ein Vektor v0 aus V existiert, so dass L(v)=λv. Ein solcher Vektor v heißt Eigenvektor von L zum Eigenwert λ. Die Menge aller Eigenvektoren zu λ (einschließlich der Nullvektors) bildet den Eigenraum V:={v|L(v)=v}.

Offensichtlich ist jeder Eigenraum ein Vektorunterraum, da Vλ=ker(LidV) bzw. (für eine Matrix A) Vλ=0(Aλ𝔼n). Nach Definition ist λK Eigenwert gdw. V{0}. Beispiele: Für n=2,K=,L=LA,AMat(2,2) betrachten wir folgende Spezialfälle.

a) Diagonalmatrix A=(a00a): Einziger Eigenwerte ist λ=a;V=2.
b) Diagonalmatrix A=(a00d), ad: Zwei Eigenwerte λ1=a, λ2=d mit Eigenvektoren e1 bzw. e2.
c) Dreiecksmatrix A=(a0ca), c0: Einziger Eigenwert ist λ=a;V=2.
d) Dreiecksmatrix A=(ab0d), b0, ad: Eigenwerte sind λ1=a und λ2=d; zugehörige Eigenvektoren sind e1=(10) und v2=(bda).
e) Symmetrische Matrix A=(abbd), b0: Es gibt stets zwei verschiedene Eigenwerte λ1,2=a+d±(ad)2+4b22.
f) Schiefsymmetrische Matrix A=(abbd), b0: Es gibt zwei verschiedene (reelle) Eigenwerte λ1,2=a+d±(ad)2+4b22 gdw. |ad|>|2b|.
g) Drehmatrix A=(cos(φ)sin(φ)sin(φ)cos(φ)), φkπ: Es gibt keine (reellen) Eigenwerte und damit keine Eigenvektoren. Dies ist ebenso aus geometrischen Gründen einsichtig.

Diese Beispiele ergeben offenbar keine vollständige Fallunterscheidung.

Satz 5.3

Eigenvektoren zu verschiedenen Eigenwerten sind linear unabhängig.

Corollar 5.4

(1) Ein Operator besitzt höchstens n=dim(V) Eigenwerte.
(2) Hat ein Operator n=dim(V) verschiedene Eigenwerte, so gibt es eine Basis aus Eigenvektoren.

Für eine Matrix lassen sich die zugehörigen Eigenwerte durch das Verschwinden von Determinanten charakterisieren:

Satz 5.5

Für AMat(n,n;K) gilt: λK ist Eigenwert von Adet(Aλ𝔼)=0.

Dies kann mittels der Matrixdarstellung auf Operatoren erweitert werden.

Definition 5.6

Das charakteristische Polynom eines Operators L bezüglich einer Basis B von V ist die Determinante: χL(T):=det(MBB(L)T𝔼).

Bemerkungen:

  • χL(T) ist unabhängig von der Wahl einer Basis B in V.
  • χL(T) ist ein Polynom vom Grad n mit Koeffizienten aus K.
  • Der höchste Term von χL(T) ist (1)nTn, der absolute Term ist det(MBB(L))=:det(L).

Beispiele: A=(aij)Mat(n,n).

n=2: χA(T)=T2(a11+a22)T+det(A).
n=3: χA(T)=T3+(a11+a22+a33)T2(a11#+a22#+a33#)T+det(A).

Generell ist der Koeffizient ci von Ti im charakteristischen Polynom χL(T) von der Form (1)ni multipliziert mit der Summe aller Hauptminoren von MBB(L) der Ordnung (ni). Ein Hauptminor ist eine Unterdeterminante der Matrix, die durch Streichen von Zeilen und Spalten mit gleichem Index entsteht, hier also von jeweils i Zeilen und Spalten.

Lemma 5.7

Ein Skalar λK ist Eigenwert von L gdw. λ ist Nullstelle des charakteristischen Polynoms χL(λ)=0.

Einschub: Aussagen zu Nullstellen von Polynomen

Definition 5.8

Mit K[T]={f(T)=i=0naiTi|n;aiK} bezeichnen wir die Menge aller Polynome in der Variablen T mit Koeffizienten im Körper K.

Polynome können addiert und multipliziert werden. Addition und Multiplikation (mit Konstanten) induzieren auf K[T] die Struktur eines K-Vektorraumes. Die konstanten Polynome (von Grad 0) identifizieren wir mit dem Körper K. Der Grad eines Polynoms ist die höchste Potenz von T: degf:=max{k|ak0}. In K[T] gilt die Teilbarkeitslehre (wie in ; wird später allgemein behandelt), insbesondere gibt es eine Division mit Rest:

Satz 5.9 (Division mit Rest)

Zu je zwei Polymonen f,gK[T],g0, gibt es stets eindeutig bestimmte Polynome q,rK[T] mit f=qg+r, wobei deg(r)<deg(g) oder r=0.

Corollar 5.10

(1) λK ist Nullstelle von f(T) gdw. (Tλ) teilt f(T), d.h. f(T)=(Tλ)h(T) für ein h(T)K[T].
(2) Ein Polynom vom Grad n besitzt höchstens n Nullstellen.
(3) k(λ):=max{k|(Tλ)k teilt f(T)} heißt Vielfachheit der Nullstelle λ von f(T).

An dieser Stelle formulieren wir:

Satz 5.10i (Fundamentalsatz der Algebra)

Jedes nichtkonstante Polynom f(T)[T] hat eine Nullstelle in , somit ist algebraisch abgeschlossen.

Daraus kann gefolgert werden, dass jeder Körper in einem algebraisch abgeschlossenen Körper liegt.

Corollar 5.11

(1) Jedes Polynom positiven Grades f(T)[T] besitzt eine eindeutige Faktorisierung in lineare Polynome: f(T)=c(Tλ1)k1...(Tλr)kr; deg(f)=ki; c,λ1,...,λr.
(2) Jedes Polynom positiven Grades f(T)[T] besitzt eine eindeutige Faktorisierung in lineare oder quadratische Polynome: f(T)=c(Tλ1)k1...(Tλr)kr(T2+a1T+b1)s1...(T2+alT+bl)sl; deg(f)=ki+2sj; aj24bj<0; c,λi,aj,bj.

Beim Auffinden rationaler Nullstellen von rationalen Polynomen hilft die folgende Überlegung, die auf einen Test endlich vieler Zahlen hinausläuft.

Lemma 5.12

Sei f(T)=anTn+...+a1T+a0 ein Polynom mit ganzzahligen Koeffizienten. Ist λ=pq eine rationale Nullstelle von f(T), dann ist p ein Teiler von a0 und q ein Teiler von an.

Warum ist der Fall von ganzzahligen Polyomen keine Beschränkung der beschriebenen Situation?

Diagonalisierbare Operatoren

Definition 5.13

Ein Operator L heißt diagonalisierbar, wenn es eine Basis in V gibt, so dass die zugehörige Matrix MBB(L) Diagonalgestalt besitzt.

Nicht jeder Operator ist diagonalisierbar. Nach der folgenden Charakterisierung kann es zwei Ursachen dafür geben.

Satz 5.14

Die folgenden Bedingungen sind äquivalent:
(1) L ist diagonalisierbar,
(2) V hat eine Basis aus Eigenvektoren von L,
(3) L(T) faktorisiert K[T] in lineare Polynome und die Vielfachheiten der Nullstellen sind die Dimensionen der zugehörigen Eigenräume.

Corollar 5.15

Die Dimension eines Eigenraumes dim(V) ist beschränkt durch die algebraische Vielfachheit der Nullstelle λ im charakteristischen Polynom L(T).

Beschränken wir uns auf den Fall, dass alle Nullstellen von L(T) aus K sind, d.h. L(T) zerfällt in K[T] in ein Produkt von Linearfaktoren. Dies ist beispielsweise über dem Körper immer erfüllt. Dann ist ein Operator genau dann nicht diagonalisierbar, wenn die Dimension eines Eigenraumes kleiner als die Vielfachheit des zugehörigen Eigenwertes im charakteristischen Polynom ist. Ein solcher Operator lässt sich stets noch mit einer Dreiecksmatrix darstellen.

Satz 5.16 (Schur-Normalform)

Zerfällt das charakteristische Polynom L(T)� vollständig in ein Produkt von Linearfaktoren, dann gibt es eine Basis B von V, so dass MBB(L) eine obere Dreiecksmatrix ist mit den Eigenwerten auf der Hauptdiagonale.

Bemerkungen:

  • Während bei einer diagonalisierbaren Matrix die Diagonalform bis auf die Reihenfolgen der Diagonalelemente (d.h. der Eigenwerte) eindeutig bestimmt ist (und damit unsere Erwartung an eine Normalform erfüllt wird), sind bei der Dreiecksform der Schur-Normalform nur die Hauptdiagonalelemente (ebenfalls die Eigenwerte) eindeutig bestimmt.
  • Hinweis: Reelle symmetrische Matrizen sind stets diagonalisierbar. (Beweis im Teil 2, Stichwort: Hauptachsentransformation)
  • Hinweis: Die Dreiecksmatrix der Schur-Normalform kann weiter vereinfacht werden, dass höchstens unmittelbar über der Hauptdiagonalen statt ’Null’ ’Eins’ stehen kann (Beweis im Teil 2, Stichwort: Jordan-Normalform).
  • Die Normalformen von Operatoren sind u.a. wichtig für die Lösung linearer Differentialgleichungssysteme!
  • Hinweis: (Simultane Diagonalisierbarkeit vertauschbarer Operatoren) Sind zwei diagonalisierbare Operatoren L1 und L2 vertauschbar, also L1L2=L2L1, dann existiert eine Basis aus gemeinsamen Eigenvektoren.

Hier ein Beispiel für die Gestalt der Jordan-Normalform (eine 010 steht höchstens nur ’zwischen’ gleichen Eigenwerten!):

(λ1000000λ1000000λ0000000μ0000000μ0000000μ1000000μ).