Kurs:Statistik für Anwender/Lagemaße

Aus testwiki
Zur Navigation springen Zur Suche springen

Lagemaße

Ein Lagemaß eines Merkmals ist ein Kennwert, der in einer bestimmten Form ’typisch’ für das Merkmal ist. In diesem Abschnitt führen wir verschiedene Lagemaße ein und untersuchen ihre Eigenschaften. Dabei wollen wir auch der Frage nachgehen, in welchen Situationen die Betrachtung dieser Werte überhaupt sinnvoll ist.

Modalwert (Modus)

Ist X:ΩA ein Merkmal, so heißt die Ausprägung aA mit der größten absoluten (bzw. relativen) Häufigkeit Modalwert (oder Modus) von X. Ein Merkmal kann einen oder mehrere Modalwerte haben.

Beispiele Modalwert

Beispiel I

100 Angestellte der RPTU Kaiserslautern-Landau werden befragt, wie sie zur Arbeit kommen:

VerkehrsmittelAutoBus/BahnFahrradzu Fußsonstigeabsolute Häufigkeit32451472


Der Modalwert ist hier die Merkmalsausprägung ’Bus/Bahn’.

Beispiel II

Bei einer Gruppe von Versuchspflanzen der selben Art wird das Wachstum der Sprossachse (in cm) gemessen, man erhält folgende Urliste:

110, 124, 120, 118, 111, 124, 128, 115, 119, 122, 106, 114, 108, 117, 124, 117, 115, 109, 114, 114, 123, 112, 116

Modalwerte sind hier 114 und 124.

Beispiel III

Bei 50 Daphnien wird die Anzahl der Nachkommen erhoben. Man erhält die folgenden absoluten Häufigkeiten:

Zahl der Nachkommen a012345811absolute Häufigkeit h(a)10131175211


Modalwert ist hier 1.

Anmerkungen zum Modalwert

Modalwerte sind schon (und insbesondere) bei Merkmalen interessant, die nach einer Nominalskala verteilt sind. Falls sehr viele Merkmalsausprägungen (im Vergleich zur Zahl der Daten) möglich sind, haben Modalwerte oft wenig Aussagekraft.

Aufgabe

Bei einer Umfrage konnten n Personen jeweils genau eine der Antwortmöglichkeiten A, B, C, D wählen.

  1. Ersetzen Sie in der folgenden Tabelle alle ’?’ durch die richtigen Zahlen.

    n=25ABCDabsolute Häufigkeit7?23relative Häufigkeit0.28??0.12



  2. Bestimmen Sie den Modalwert.

  3. Erstellen Sie in Bezug auf die absolute Häufigkeit ein Balken- und ein Kreisdiagramm.

Median

Ist X ein mindestens nach einer Ordinalskala verteiltes Merkmal mit der geordneten Datenreihe x1x2xn, so definiert man den Median X0.5 wie folgt:

  • Ist n ungerade, so ist X0.5=x(n+12).
  • Ist n gerade, so X0.5=12(x(n2)+x(n2+1)).
    (Manchmal bezeichnet man auch x(n2) und x(n2+1) beide als Mediane. Dies macht insbesondere Sinn, wenn X ordinalskaliert ist.)


Beispiel Median

(vergleiche Beispiele Modalwert)

  • Beispiel I: Bildung des Medians macht hier keinen Sinn
  • Beispiel II: Die geordnete Datenreihe ist:

106,108,109,110,111,112,114,114,114,115,115,,117,117,118,119,
120,122,123,124,124,124,128
Bei 23 Werten ist der 12.Wert der Median, also X0.5=116.

  • Beispiel III: Bei 50 Werten ergibt sich der Median aus dem 25. und dem 26-ten Wert, also X0.5=2+22=2.

Weitere Anmerkungen

  • Es ist klar, dass der Median für nach einer Nominalskala verteilte Merkmale keinen Sinn macht.
  • Der Median besitzt (insbesondere im Vergleich zum noch folgenden arithmetischen Mittelwert) die Eigenschaft, dass er stabil gegenüber sogenannten ’Ausreißern’ ist, das heißt einzelne sehr große oder sehr kleine Beobachtungswerte haben nur geringe (oder keine) Auswirkungen auf den Median. Dies ist in vielen Situationen (aber nicht immer) ein Vorteil.

Berechnung Median in R

  • In R: Man erstellt einen Vektor daten mit den Daten der Urliste, also z.B. daten<c(110,124,120,118,111,124,128,115,119,122,106,114,108,
    117,124,117,115,109,114,114,123,112,116)

    und kann dann mit median(daten) den Median berechnen.

Arithmetischer Mittelwert

Den wohl bekanntesten Mittelwert einer Reihe von (Beobachtungs-)Werten erhält man, indem man alle Werte addiert und dann durch die Anzahl der Werte teilt. Dies ist nur bei quantitativen Merkmalen sinnvoll. Man definiert:
Ist X:Ω={ω1,,ωn} ein quantitatives Merkmal, so heißt
X=1nj=1nX(ωj)
arithmetischer Mittelwert
des Merkmals X. Oft ersetzt man hierbei X(ωj) durch xj und schreibt X=1nj=1nxj.


Der arithmetische Mittelwert kann auch wie folgt berechnet werden: X=1ni=1mh(ai)ai=i=1mr(ai)ai

Beispiel arithmetischer Mittelwert

(vergleiche Beispiele Modalwert)

  • Beispiel I: Bildung des arithmetischen Mittelwerts macht hier keinen Sinn
  • Beispiel II: Der arithmetische Mittelwert ist
    X=116.52
  • Beispiel III: Der arithmetische Mittelwert ist
    X=2.1

Linearität des Mittelwerts

Ist X ein quantitatives Merkmal und sind a,b, so ist
aX+b:Ω, (aX+b)(ω)=aX(ω)+b
ebenfalls ein quantitatives Merkmal mit derselben Skala und es gilt:
aX+b=aX+b

Beispiel Linearität des Mittelwerts

Gegeben sei ein Merkmal X:{ω1,,ω8}, das Temperaturen in Grad Celsius angibt. Ein weiteres Merkmal Y:{ω1,,ω8} soll nun (für dieselbe Grundgesamtheit) die entsprechenden Temperaturen in Grad Fahrenheit angeben. Damit gilt Y=95X+32. Es ergeben sich folgende Urlisten: ωω1ω2ω3ω4ω5ω6ω7ω8X(ω)9.13.56.97.73.37.04.85.8Y(ω)=95X(ω)+3248.3838.3044.4218.1437.9444.6040.6442.44 Man berechnet:X=4.0875undY=39.3575=95X+32

Additivität des Mittelwerts

Sind

X,Y

quantitative Merkmale mit derselben Grundgesamtheit, die nach derselben Skala verteilt sind. Dann ist

X+Y:Ω, (X+Y)(ω)=X(ω)+Y(ω)


ebenfalls ein quantitatives Merkmal mit dieser Skala und es gilt:

X+Y=X+Y

Beispiel Additivität des Mittelwerts

Gegeben sei die Grundgesamtheit Ω={t1,,t5}, die die 5 Werktage einer bestimmten Woche enthält. Ein Schüler bestimmt an allen Tagen, die Zeit (jeweils in Minuten), die er für die Hausaufgaben in Mathematik (Merkmal M) und in Deutsch (Merkmal D) benötigt. Das Merkmal G=M+D beschreibt die Gesamtzeit für beide Fächer. Es ergibt sich: tt1t2t3t4t5M(t)133101520D(t)51422630G(t)=M(t)+D(t)1845227820 Man berechnet:

M=15.8,D=20.8undM+D=36.6=M+D

Anmerkung zur Verknüpfung durch Multiplikation

Im Allgemeinen gilt nicht X2=X2 bzw. XY=XY.

Beispiel I

5 quadratische Grundstücke ω1,,ω5 haben die Seitenlängen (in Metern): S(ω1)=24,S(ω2)=10,S(ω3)=14,S(ω4)=12,S(ω5)=20 Man berechnet daraus S=16.
Die Flächeninhalte der Grundstücke werden durch F=S2 beschrieben, es ist:
F(ω1)=S(ω1)2=576,F(ω2)=S(ω2)2=100,F(ω3)=S(ω3)2=196,
 F(ω4)=S(ω4)2=144, F(ω5)=S(ω5)2=400
Man berechnet daraus F=283.2=162. Also hier: S2=S2

Beispiel II

Ein Wanderer geht an 4 Tagen t1,t2,t3,t4 jeweils eine bestimmte Zeit Z(ti) (in Stunden) mit konstanter Geschwindigkeit G(ti) (in Kilometer pro Sunde). Daraus ergibt sich die zurückgelegte Strecke S=ZG (in km): Tagt1t2t3t4ZeitZ(t1)=3Z(t2)=5Z(t3)=2Z(t4)=2GeschwindigkeitG(t1)=5G(t2)=4G(t3)=7G(t1)=4StreckeS(t1)=15S(t2)=20S(t3)=14S(t4)=8 Daraus berechnet man: Z=3, G=5, S=14.25=35 Also hier: ZG=ZG

Berechnung Arithmetischer Mittelwert in R

In R: Man erstellt einen Vektor daten mit den Daten der Urliste und kann dann mit mean(daten) den arithmetischen Mittelwert berechnen.

Weitere Anmerkungen zum Arithmetischen Mittelwert

  • Zur Bildung des arithmetischen Mittelwerts ist auf jeden Fall eine Intervallskala nötig. Umgekehrt ist auch nicht bei jeder Intervallskala auch die Bildung des arithmetischen Mittelwerts sinnvoll.
  • Ergänzend zum arithmetischen Mittelwert gibt es auch den gleitenden Mittelwert, welcher insbesondere bei unregelmäßigen Datenreihen Anwendung findet. Mit
    x¯k(n):=1ni=0n1xk+i
    wird der k-te Mittelwert über n Daten erhoben. Auf diese Art können die Daten "geglättet" werden.

.

Seiteninformation

Diese Lernresource können Sie als Wiki2Reveal-Foliensatz darstellen.

Wiki2Reveal

Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Kurs:Statistik für Anwender' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.