Kurs:Maschinelles Lernen/Vektoren

Aus testwiki
Zur Navigation springen Zur Suche springen

Vorherige Seite: K0 - Ableitungen
Nächste Seite : K0 - Matrizen

Definiton

Punkte im dreidimensionalen Raum werden durch x-, y- und z-Koordinaten in der Form P(x|y|z) angegeben. Stattdessen kann auch der verbindende Pfeil zum Ursprung

p=(xyz)

betrachtet werden. Dieser kann unter beibehalt von Länge und Richtung verschoben werden. Er wird als Vektor bezeichnet.

Die Menge der dreidimensionalen Vektoren wird als 3 bezeichnet.

Regeln

Betrag und Richtung

Die Länge eines Vektors wird als sein Betrag bezeichnet und ist durch

|p|=x2+y2+z2

definiert. Ist dieser nicht Null, so lässt sich damit ein Vektor

n^=p|p| 

der Länge Eins definieren, welcher die Richtung des Vektors angibt.

Vektoraddition

Vektoren lassen sich komponentenweise addieren

a+b=(axayaz)+(bxbybz)=(ax+bxay+byaz+bz)

Geometrisch entspricht dies einer Aneinanderreihung der Vektoren. Ebenso lässt sich die Differenz zweier Vektoren

ab=(axayaz)(bxbybz)=(axbxaybyazbz)

definieren. Der Differenzvektor ab gibt an, welcher Vektor an b angehängt werden muss, um Vektor a zu erhalten.

(Komponentenweise) Skalarmultiplikation

Ein Vektor lässt sich komponentenweise mit einer reellen Zahl λ multiplizieren
λp=λ(xyz)=(λxλyλz)|λp|=|λ||p|
Geometrisch handelt es sich um eine Streckung, Stauchung oder Spiegelung am Ursprung abhängig vom Wert von λ.

Aufgabe

Gegeben seien die beiden Vektoren

a=(123)b=(121).

Bestimme den Ausdruck 3a2b

Lösungen

Skalarprodukt

Manchmal ist es nötig, einen Vektor a in parallele und senkrechte Anteile zu einem gegebenen Vektor n zu zerlegen. Die beiden Vektoren schließen den Winkel ϕ ein. Aus geometrischen Überlegungen lässt sich zeigen, dass der parallele Anteil den Betrag

|a|=|a|cos(ϕ)

bestitzt. (Streng genommen, gilt das nur für ϕ[π/2,π/2].) Eingebettet in ein explizites Koordinatensystem lässt sich weiter zeigen, dass der Zusammenhang

axnx+ayny+aznz=|a||n|cos(ϕ)

gültig ist. Dieser wird benutzt, um das Skalarprodukt zweier Vektoren a und b

ab=(axayaz)(bxbybz)=axbx+ayby+azbz=|a||b|cos(ϕ)

zu definieren. Der parallele Anteil von a muss dann in Richtung von n zeigen und kann daher durch

a=|a|n|n|=n|n|(n|n|a)

bestimmt werden. Der senkrechte Anteil ist durch

a=aa=an|n|(n|n|a)

gegeben.

Aus der Definition des Skalarprodukts lässt sich eine wichtige Schlussfolgerung ziehen. Sind sowohl die Vektoren a, b nicht in allen Komponenten Null (also der Nullvektor), das Skalarprodukt aber dennoch Null, so muss der Kosinus den Wert Null annehmen. Dies ist aber nur möglich, wenn ϕ die Wert π/2 oder 3π/2 annimmt. Da ϕ aber den Winkel zwischen den beiden Vektoren beschreibt, stehen die Vektoren in diesem Fall senkrecht aufeinander. Allgemeiner werden Vektoren deren Skalarprodukt verschwindet als orthogonal bezeichnet.

Ebenso lässt sich wegen

aa=ax2+ay2+az2=|a|2

der Betrag eines Vektors mittels des Skalarprodukts durch

|a|=aa

ausdrücken.

Aufgabe

Bestimme das Skalarprodukt der beiden Vektoren a und b aus der vorherigen Aufgabe. Stehen die beiden Vektoren senkrecht aufeinander?

Lösungen

Vektoren in N Dimensionen

Die bisherigen Betrachtungen lassen sich auf n Dimensionen erweitern. Die Menge der N-dimensionalen Vektoren wird mit N bezeichnet.

Die Vektoradditon erfolgt nach wie vor komponentenweise

(a±b)i=ai±bi

ebenso die Skalarmultiplikation

(λa)i=λai.

Beim Skalarprodukt zweier Vektoren werden die Vektoren komponentenweise multipliziert und die jeweiligen Ergebnisse addiert, so dass

ab=i=1Naibi=|a||b|cos(ϕ)

gilt. Der Betrag eines Vektors kann weiterhin durch

|a|=aa=i=1Nai2 

betsimmt werden.

Geraden und Ebenen im Raum

Geraden im 2

Vektoren eröffnen eine neue Betrachtungsweise auf Geraden, die in der Analysis durch die Geradengleichung y=mx+b beschrieben werden. Dazu werden Vektoren des 2 betrachtet.

  • Es gibt (bis auf die Länge und das Vorzeichen) nur einen Richtungsvektor n der senkrecht auf der Geraden steht. Ein solcher Vektor wird als Normalenvektor bezeichnet.
  • Der Abstandsvektor zweier Punkte, beschrieben durch die Ortsvektoren a und b, muss senkrecht auf dem Normalenvektor stehen. Ein bekannter Ortsvektor eines Punktes auf der Gerade wird als Stützvektor bezeichnet.

Damit lässt sich begründen, dass für einen bekannten Normalenvektor n und einen bekannten Stützvektor a die Ortsvektoren x der Gerade die Gleichung

n(xa)=0

erfüllen müssen. Diese Gleichung lässt sich mit der Einführung von c=na auch durch

0=nxna=nxc

ausdrücken.

Die Gerade teilt darüber hinaus den Raum in zwei Bereiche. Wird ein Punkt eingesetzt, dessen Ortsvektor nicht auf der Gerade liegt, so ergibt sich beim Auswerten von nxc ein Wert größer oder kleiner Null. Damit lassen sich die beiden Mengen

M+={x2|nxc>0}M={x2|nxc<0}

definieren. Diese Betrachtungsweise erlaubt es im Rahmen des maschinellen Lernens Entscheidungsregeln durch Vektoren zu beschreiben.

Aufgabe

Im 2 soll eine Gerade mit c=2 und dem Normalenvektor

n=(12)

gegeben sein. Bewerte, ob die Punkte P1(1|0), P2(1|1) und P3(0|1) auf der Gerade oder in den Mengen M± liegen.

Lösungen

Ebenen im N dimensionalen Raum

Im 3 wird der gesamte Raum durch eine Ebene in zwei Bereiche getrennt. Um Punkte in der Ebene zu beschreiben genügt es wieder, einen Vektor n senkrecht auf der Ebene - der auch als Normalenvektor bezeichnet wird - und einen Vektor in der Ebene a - der ebenfalls als Stützvektor bezeichnet wird - zu kennen. Die Ortsvektoren x der Punkte der Ebene müssen dann die Gleichung

n(xa)=nxc=0

erfüllen. Genau, wie im zweidimensionalen Fall lassen sich die beiden Raumbereiche

M+={x3|nxc>0}M={x3|nxc<0}

definieren.

All diese Betrachtungen lassen sich auf N Dimensionen übertragen. Dort wird durch die Gleichung

n(xa)=nxc=0

ein N1 dimensionales Objekt beschrieben, dass als Hyperebene bezeichnet wird. Der N-dimensionale Raum wird in die beiden Bereiche

M+={xN|nxc>0}M={xN|nxc<0}

geteilt.

Aufgabe

Betrachte eine Hyperebene mit c=2 und dem Normalenvektor

n=(11311)

und bestimme, ob die Punkte P1(1|1|1|1|1), P2(0|0|0|0|0) und P(2|2|2|2|2) auf der Hyperbene oder in den Mengen M± liegen.

Lösungen

Abstände zu Hyperebenen

Beim Maschinellen Lernen können Hyperebenen für Entscheidungsregeln genutzt werden. Eine Entscheidung ist eindeutiger, je größer der Abstand der Trainingsdaten von der Ebene der Entscheidungsregel ist. Daher gibt es Methoden (wie die Support Vector Machines) bei denen diese Abstände minimiert werden. Dazu ist es nötig, Abstände zwischen Punkten und Ebenen bestimmen zu können.

Liegt ein Punkt mit dem Ortsvektor p nicht in der Ebene, so kann der Verbindungsvektor zwischen diesem Punkt und dem Stützvektor a der Ebene betrachtet werden. Da der Abstand zur Ebene durch den Abstand einer auf der Ebene senkrecht stehenden Verbindungslinie gegeben ist, muss die Länge des zum Normalenvektor parallelen Anteil des Differenzvektors bestimmt werden. Nach den Betrachtungen beim Skalarprodukt lässt sich so erkennen, dass der Abstand zwischen einem Punkt P und einer Hyperebene H durch

d(P,H)=|n(pa)||n|

gegeben ist.

Aufgabe

Bestimme für die obige Hyperebene im 5 dimensionalen Raum den Abstand der Punkte P2 und P3 zu diesen.

Lösungen