Kurs:Maschinelles Lernen/Lineare Regression in einer Dimension

Aus testwiki
Version vom 6. Mai 2024, 13:05 Uhr von imported>MarkEich96
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Zur Navigation springen Zur Suche springen

Vorherige Seite: K1 - Hypothesen aus Daten Ableiten
Nächste Seite : K2 - Lineare Regression in d Dimension

Für die Regression in einer Dimension ist X=Y= gültig, Es wird zunächst davon ausgegangen, dass ein linearer Zusammenhang vorliegt, der das Aufstellen der Hypothese

hw(x)=w0+w1x

erlaubt. Damit wird als Hypothesenraum der Raum der linearen Funktionen Hlin betrachtet, der isomorph zu 2 ist. Das empirische Risiko wird bei Regressionen durch

R^=1Ni=1N(hw(xi)yi)2=1Ni=1N(w0+w1xiyi)2

bestimmt und soll minimiert werden. Dies bedeutet, dass die Ableitungen von R^ nach w0 bzw. w1 verschwinden müssen. Durch das Lösen der Gleichungen können die idealen Parameter w0 und w1 bestimmt werden. Zu diesem Zweck bietet es sich an, einige statistische Größen zu definieren:

  • Der Mittelwert eines Satzes von N Werten fi einer Größe f ist durch f=1Ni=1Nfi definiert.
  • Die Varianz gibt die Streuung um den Mittelwert an und kann durch σ2(f)=1Ni=1N(fif)2 gefunden werden.
  • Liegen Werte zweier Größen f und g vor, so kann die Kovarianz s(f,g)=1Ni=1N(fif)(gig) definiert werden. Aus ihr wird häufig auch die Korrelation ρ(f,g)=s(f,g)σ2(f)σ2(g) definiert. Im Fall ρ=0 wird von (linear) unkorrellierten Daten gesprochen, d.h. es besteht kein linearer Zusammenhang zwischen den Größen f und g. Nimmt ρ positive bzw. negative Werte an, so wird von positiver bzw. negativer Korellation gesprochen. Das bedeutet, dass eine Größe steigt, während die andere steigt bzw. fällt.

Mit diesen Begriffen, lassen sich die idealen Gewichte

w1=s(x,y)s(x,x)w0=ys(x,y)s(x,x)x

bestimmen.

Aufgabe

Betrachte den Datensatz der folgenden Tabelle, der aus einer linearen Funktion mit Steigung 0,5 und y-Achsenabschnitt 1 mit einem gleichverteilten Rauschen der Amplitude ±0,125

Daten
x y
1,03 1,55
1,61 1,90
1,79 2,00
2,52 2,34
2,89 2,43

Bestimme die Größen x, y, x2, xy, s(x,x), s(x,y), w0 und w1 bis auf zwei Nachkommastellen genau.

Lösungen