Kurs:Lineare Algebra I/Affine Räume

Aus testwiki
Zur Navigation springen Zur Suche springen

Punkte und Vektoren

Im Kapitel 1 haben wir den Standardraum n eingeführt und seine Elemente einmal als Punkte und andererseits als Vektoren interpretiert. Die naive Vektorvorstellung (als gerichtete Strecke) war hilfreich zur Veranschaulichung der Operationen Vektoraddition und skalare Multiplikation, die für Punkte keinen Sinn machen. Ferner gibt es im Vektorraum stets ein ausgezeichnetes Element - den Nullvektor. Dagegen sind im Punktraum alle Elemente gleichberechtigt. Durch den Begriff des affinen Punktraumes werden wir mathematisch korrekt zwischen Punkten und Vektoren unterscheiden. Nehmen wir den naiven Punktraum als gegeben, dann wollen wir jetzt Vektoren als Parallelverschiebungen (Translationen) des Punktraumes interpretieren, die sich durch einen (ungebundenen) Pfeil charakterisieren lassen. Translationen können verknüpft werden (Hintereinanderausführung der Abbildungen) und durch einen skalaren Faktor gedehnt (resp. gestaucht) werden. Diese beiden Operationen induzieren die Struktur eines Vektorraumes auf der Menge aller Translationen des Punktraumes. Dieses Modell führt zum Begriff des affinen Raumes, die zugehörige mathematische Theorie ist die analytische Geometrie. Lineare Algebra und analytische Geometrie sind zwei verschiedene Betrachtungsweisen zum gleichen mathematischen Gebiet.

Definition 4.1

Ein affiner Raum ist ein Tripel (𝐀,T𝐀,+) aus einer nichtleeren Punktmenge 𝐀, einem Vektorraum (von Translationen) T𝐀 und einer Abbildung (Operation von T𝐀 auf 𝐀) der Form Punkt+Vektor=Punkt:
+:𝐀×T𝐀𝐀,(P,x)P+x,
die folgenden Regeln genügt:
(a1) P+0=P,
(a2) (P+x)+y=P+(x+y),
(a3) Je zwei Punkte P,Q bestimmen eindeutig einen Vektor x mit P+x=Q.

Schreibweisen: x=PQ=vec(P,Q). Jedem Vektor xT𝐀 entspricht die Translation tx:𝐀𝐀,PP+x. Die Dimension eines affinen Raumes ist die Dimension des zugehörigen Vektorraumes, dim𝐀:=dimT𝐀. Meist spricht man allein von der Punktmenge 𝐀 als affinen Raum ohne den zugehörigen Vektorraum explizit anzugeben. Die Punktmenge ist bijektiv zum Vektorraum der Translationen nach Fixierung eines Punktes P0, indem jedem Punkt Q der ’Ortvektor’ von Q bzgl. P0 zugeordnet wird: 𝐀T𝐀,Qvec(P0,Q). Die dazu inverse Abbildung lautet: xP0+x.

Definition 4.2

Eine Teilmenge eines affines Raumes H𝐀 der Form H=P+TH,PH und THT𝐀 ein Vektorunterraum, heißt affiner Unterraum.

Ein affiner Unterraum ist selbst affiner Raum. Für jeden Punkt PH gilt P0+TH=H=P+TH. Beispiele:

1. Der affine n-dimensionale Standardraum: 𝐀n=(Kn,Kn,+). Zur Unterscheidung zwischen Punkten und Vektoren wird eine (n+1)-te Komponente vorangestellt, die 1 für Punkte und 0 für Vektoren gesetzt wird.
2. Die Lösungsmenge eines inhomogenen linearen Gleichungssystems :=(A,b) ist ein affiner Raum. Die Translationen sind die Lösungen des zugehörigen homogenen Gleichungssystems (A,0). ist affiner Unterraum des affinen Standardraumes 𝐀n. Umgekehrt ist jeder affine Unterraum des Standardraumes Lösungsmenge eines linearen Gleichungssystems.
3. Je zwei verschiedene Punkte P,Q𝐀 liegen in einem eindeutig bestimmten affinen Unterraum:
L(P,Q):={X𝐀|X=P+tvec(P,Q),tK}, der Geraden durch P und Q.

Satz 4.3

Eine Teilmenge H𝐀 von Punkten eines affinen Raumes ist affiner Unterraum gdw. mit je zwei Punkten die Gerade durch diese Punkte in H liegt: P,QHL(P,Q)H.

Folgende Einschränkung ist zu beachten: Im Beweis wird benutzt: 1+10 in K. Dies ist nicht in jedem Körper erfüllt. Man denke an K=𝔽2. Deshalb ist diese Bedingung notwendige Voraussetzung des Satzes!

Lage affiner Unterräume

Der Durchschnitt zweier affiner Unterräume ist offensichtlich wieder ein affiner Unterraum, falls es einen gemeinsamen Punkt gibt: Sei P0H1H2, dann gilt H1H2=P0+(TH1TH2). Im Gegensatz zu Vektorunterräumen kann der Durchschnitt affiner Unterräume leer sein:

Definition 4.4

Seien H1,H2𝐀 zwei affine Unterräume mit leerem Durchschnitt. H1 und H2 heißen zueinander parallel, falls die zugehörigen Translationsräume ineinander enthalten sind, d.h. TH1TH2 oder umgekehrt. Andernfalls heißen die Unterräume windschief.

Jeder Punktmenge ordnen wir den kleinsten affinen Unterraum zu, der diese enthält:

Definition 4.5

Sei M𝐀 eine Menge von Punkten, dann heißt der kleinste affine Unterraum, der M enthält, die affine Hülle (M).

Lemma 4.6

(P0,...,Pk)=P0+Lin{vec(P0,P1),...,vec(P0,Pk)}.

Bezeichne H1H2:=(H1H2) als Verbindung der affinen Unterräume H1 und H2. Man vergleiche die ’affine Hülle’ mit der ’linearen Hülle’. Welche Konstruktion im Vektorraum entspricht der ’Verbindung’? Ist P0H1H2, dann ist H1H2=P0+(TH1+TH2). Dies gilt jedoch nur, wenn der Durchschnitt der Unteräume nicht leer ist. Allgemein haben wir die folgende Aussage:

Lemma 4.7

Seien H1 und H2 affine Unterräume, seien P1H1 und P2H2 zwei Punkte. Die affine Hülle von H1 und H2 ist von der Form H1H2:=P1+U, wobei U:=TH1+TH2+Kvec(P1,P2).

Corollar 4.8 (5. Dimensionsformel)

Ist H1H2=, dann gilt dim(H1H2)=dim(H1)+dim(H2)dim(TH1TH2)+1.

Der linearen Unabhängigkeit von Vektoren entspricht die allgemeine Lage von Punkten.

Definition 4.9

Die Punkte P0,...,Pk𝐀 heißen in allgemeiner Lage, wenn Pi+1(P0,...,Pi) für i=0,...,k1.

Lemma 4.10

P0,...,Pk𝐀 sind in allgemeiner Lage gdw. dim((P0,...,Pk))=k gdw. {vec(P0,P1),...,vec(P0,Pk)} linear unabhängig in TA.

Insbesondere hängt damit die Eigenschaft ´allgemeine Lage´ nicht von der Reihenfolge der Punkte ab. Maximal (n+1) Punkte sind in einem n-dimensionalen affinen Raum in allgemeiner Lage. (Hinweis: Hat eine Punktmenge M mehr als (dim(𝐀)+1) Elemente, so gibt es noch eine verallgemeinerte Variante zum Begriff ’allgemeine Lage’, in dem definiert wird: dim((N))=min{#N1,dim(𝐀)} für jede Teilmenge NM. Frage: Wie könnte man den Begriff ’allgemeine Lage’ für eine beliebige Menge von Vektoren formulieren?)

Satz 4.11

Jeder affine Unterraum H𝐀n ist Lösungsmenge eines linearen Gleichungssystems:
H=(A,b).

Affine und baryzentrische Koordinaten

Im Vektorraum induziert jede Basis einen Koordinatenisomorphismus auf den Standardvektorraum. Im affinen Raum gilt dies analog, man benötigt dafür stets noch einen Punkt. Damit kann dann insbesondere der letzte Satz auf jeden affinen Raum verallgemeinert werden.

Definition 4.12

Eine Menge K=(P0,v1,...,vn) bestehend aus einem Punkt von 𝐀 (Ursprung) und einer Basis von T𝐀 heißt affines Koordinatensystem. Die zugehörige Koordinatenabbildung ΦK:𝐀𝐀n ordnet jedem Punkt P=P0+λ1v1+...+λnvn das Koordinaten-Tupel (P)K:=(1;1,...,n)t zu.

Analog zum Basiswechsel gibt es reguläre Transformationsmatrizen hier aus Gln+1 der Form T~=(10bT), die den Wechsel des Koordinatensystems beschreiben. Dabei ist T die Transformationsmatrix zwischen den Basen des zugehörigen Vektorraumes und in der ersten Spalte (1;b1,...,bn)t stehen die Koordinaten des Ursprungs bzgl. des neuen Koordinatensystems. Für Anwendungen in der linearen Optimierung sind die folgenden Begriffe bedeutsam. Sie gelten im wesentlichen jedoch nur für reelle affine Räume. Deshalb sei bis zum Ende dieses Anschnittes K= vorausgesetzt, d. h. alle affinen Räume und Vektorräume seien reell. Zur Einführung der so genannten baryzentrischen Koordinaten benötigen wir die folgende Vorbereitung.

Lemma 4.13

Seien P0,...,Pk𝐀 Punkte und λ0,...,λk reelle Zahlen mit λ0+...+λk=1, dann ist der Punkt P:=Q+λ0vec(Q,P0)+...+λkvec(Q,Pk) unabhängig von der Auswahl eines Punktes Q.

Definition 4.14

Seien P0,...,Pk𝐀 Punkte und λ0,...,λk reelle Zahlen mit λ0+...+λk=1, dann heißt P=λ0P0+...+λkPk eine baryzentrische Darstellung bzgl. der Punkte P0,...,Pk. Dies ist wohldefiniert durch P:=P0+i=1kλivec(P0,Pi).

Bemerkungen:

  • Ein Punkt P besitzt eine baryzentrische Darstellung bzgl. der Punkte P0,...,Pk gdw. P(P0,...,Pk).
  • Die baryzentrische Darstellung eines Punktes P ist eindeutig gdw. die Punkte P0,...,Pk in allgemeiner Lage sind. In diesem Fall sprechen wir von den Koeffizienten λ0,...,λk als die baryzentrischen Koordinaten von P.
  • Ein Punkt QL(A,B) liegt zwischen A und B gdw. Q=sA+tB und s+t=1 und 0s,t. Mit [A,B] bezeichnen wir die Menge dieser Punkte, also die Strecke von A nach B. Entsprechende Verallgemeinerungen gelten für konvexe Vielecke. (Hier benötigen wir für die Ordnungsrelation die reellen Zahlen!)
  • Der Punkt 12A+12B ist der Mittelpunkt der Strecke [A,B].
  • Der Punkt 13A+13B+13C ist der ’Schwerpunkt’ des Dreiecks mit dem Ecken A,B,C (hier auch der Schnittpunkt der Seitenhalbierenden).

Entsprechende Verallgemeinerungen gelten für Vielecke. Von besonderem Interesse in der linearen Optimierung sind konvexe Polyeder als höher-dimensionale Verallgemeinerung von konvexen Vielecken. Am einfachsten lassen sich konvexe Polyeder als konvexe Hülle einer endlichen Punktmenge beschreiben:

Definition 4.15 (konvex, konvexe Hülle, endliches konvexes Polyeder)

Eine Teilmenge K𝐀 heißt konvex, wenn mit je zwei Punkten A,BK die Verbindungsstrecke [A,B] stets in K liegt. Sei M𝐀 eine Punktmenge. Die konvexe Hülle K(M) ist die kleinste konvexe Obermenge von M. Ein endliches konvexes Polyeder ist die konvexe Hülle von endlich vielen Punkten.

Die konvexe Hülle ist (wie auch die lineare und die affine Hülle) ein Hüllenoperator, d. h. K(K(M))=K(M). Die konvexe Hülle von k+1 Punkten in allgemeiner Lage wird ein k-Simplex genannt.

Satz 4.16

K(P0,...,Pk)={i=0kλiPi|λi0,λi=1}.

Offensichtlich ist der Durchschnitt konvexer Mengen wieder konvex. Die Menge der Punkte, die eine lineare Ungleichung erfüllen, nennen wir Halbraum. Halbräume sind konvex. Damit ist die Lösungsmenge eines Systems von linearen Gleichungen und linearen Ungleichungen ebenfalls konvex. In der linearen Optimierung wird daran anknüpfend die Frage gestellt, für eine konvexe Menge gegeben durch lineare Gleichungen und lineare Ungleichungen zu entscheiden, ob sie ein endliches Polyeder ist und wie die Ecken zu finden sind.

Affine Abbildungen

Zwischen affinen Räumen betrachten wir affine Abbildungen. Diese sollen geometrische Eigenschaften im affinen Raum erhalten: (1.) Geraden bleiben erhalten. (2.) Teilverhältnisse bleiben erhalten.

Liegen A,B,C auf einer Geraden L, AB, dann ist vec(A,C)=λvec(A,B). Die Zahl λ wird Teilverhältnis von A,B,C genannt: (A:B:C):=λ. Um die folgende Definition einer affinen Abbildung zu motivieren, schließen wir wie folgt: Sei φ eine Abbildung mit den Eigenschaften (1.) und (2.). Wir betrachten das Bild des Parallelogramms mit den Eckpunkten A,B:=A+a, C:=A+a+b und D:=A+b einschließlich seiner Diagonalen. Dies ist dann wieder ein Parallelogramm (warum?). Damit induziert φ eine Abbildung, und sogar eine lineare:

Tφ:T𝐀T𝐀,vec(P,Q)vec(φ(P),φ(Q)).

Definition 4.17

Seien 𝐀 und 𝐀 affine Räume, eine Abbildung φ:𝐀𝐀 heißt affin, wenn eine lineare Abbildung der zugehörigen Vektorräume Tφ:T𝐀T𝐀 existiert, so dass gilt: φ(Q)=φ(P)+Tφ(vec(P,Q)) für alle Punkte P,Q𝐀.

Anders gesagt, eine affine Abbildung ist die Komposition einer Translation mit einer linearen Abbildung.

Beispiele: Translationen (hier: Tφ=id), Parallelprojektionen in einen affinen Unterraum (hier ist Tφ ein Projektionsoperator: Tφ=Tφ2) und Zentralprojektionen zwischen parallelen Unterräumen (hier: Tφ=λid).

Analog zum Prinzip der linearen Fortsetzung in Vektorräumen gilt für affine Abbildungen:

Satz 4.18

Eine affine Abbildung φ:𝐀𝐀 ist eindeutig bestimmt durch das Bild von (n+1) Punkten in allgemeiner Lage, n=dim𝐀.

Insbesondere können wir einer affinen Abbildung φ:𝐀n𝐀m eine Matrix M(φ)Mat(m+1,n+1) zuordnen. Dabei ergeben sich die Spalten aus den Bildern φ(0),Tφ(e1),...,Tφ(en), also M(φ)=(10φ(0)M(Tφ)). Entsprechend der Konvention mit der ’0-ten Komponente’ gilt sowohl für Punkte, als auch für Vektoren: φ(P)=M(φ)P und Tφ(x)=M(φ)x. Ferner kann unschwer der Formalismus der Darstellungsmatrix einer affiner Abbildung bzgl. affiner Koordinatensysteme formuliert werden. Es gelten analoge Transformationsformeln.