Kurs:Statistik für Anwender/Chi-Quadrat-Tests

Aus testwiki
Zur Navigation springen Zur Suche springen

Verschiedene Χ²-Tests

Arten des Χ²-Tests

Vom χ2-Test existieren verschiedene Varianten, mit denen man die folgenden Arten von Nullhypothesen untersuchen kann:

  • Anpassungstest bzw. Test auf Verteilung:
    H0: Für eine ZV liegt eine bestimmte (angegebene) Verteilung vor.
  • Homogenitätstest:
    H0: Zwei (oder mehr) unabhängige ZV haben dieselbe Verteilung.
  • Unabhängigkeitstest:
    H0: Zwei (verbundene) ZV sind unabhängig voneinander.


Χ²-Anpassungstest:

Mit einem χ2-Anpassungstest kann für eine diskrete oder stetige ZV getestet werden, ob eine ganz bestimmte (vermutete oder zu widerlegende) Verteilung vorliegen könnte.

Χ²-Anpassungstest für diskrete Verteilung

Voraussetzung, Hypothesenpaar und Daten

Voraussetzung: diskrete ZV X mit den möglichen Werten a1,,am

Hypothesenpaar: H0: P(X=a1)=p1 , P(X=a2)=p2 ,  , P(X=am)=pm
H1:P(X=ak)=pk für mindestens ein k{1,,m} (Hierbei sind bestimmte (zu prüfende) Werte p1,,pm für die Wahrscheinlichkeiten P(X=a1),,P(X=am) vorgegeben. Dabei muss natürlich p1++pm=1 gelten.)

Vorliegende Daten: Stichprobe x1,,xn der Länge n
Daraus ermittelt man die absoluten Häufigkeiten h(ak)=hk=Anzahl der j mit xj=ak(k=1,,m)

Teststatistik und p-Wert

Teststatistik: T=k=1m(hknpk)2npk (hohe Werte von T sprechen gegen H0)
Idee: Falls H0 gilt, so erwartet man, dass hk nahe bei npk ist (man bezeichnet npk auch als erwartete absolute Häufigkeit) und dass sich somit ein niedriger Wert für T ergibt. Folglich sprechen hohe Werte von T gegen H0, niedrige Werte von T sind mit H0 vereinbar.

p-Wert zu konkreter Teststatistik T: 𝔭=1Sm1(T)=1pchisq(T,m1)
Dabei bezeichnet Sm1 die Verteilungsfunktion einer χ2-Verteilung mit m1 FG.

Durchführung mit R

chisq.test(h,p=c(p1,,pm))
Dabei müssen die beobachteten absoluten Häufigkeiten in einem Vektor h zusammengefasst sein.

Beispiel 1.1

Ein Würfel soll überprüft werden, ob er alle Augenzahlen mit der gleichen Wahrscheinlichkeit zeigt. Man betrachtet also die ZV ’Augenzahl’ A. Diese kann nur die Werte a1=1,,a6=6 annehmen. Zu prüfen ist, ob diesen Werten die Wahrscheinlichkeiten p1=16,,p6=16 zugeordnet sind. Wir testen dazu die Nullhypothese H0: P(A=1)=16, P(A=2)=16, ,P(A=6)=16
Zur Überprüfung von H0 wird der Würfel n=600-mal geworfen. Es ergeben sich die folgenden (absoluten) Häufigkeiten der Augenzahlen:

Augenzahl123456absolute Häufigkeit91122979510788unter H0 erwartete absolute Häufigkeit100100100100100100

Beispiel 1.2

(Kann man anhand dieser Beobachtungen davon ausgehen, dass bei diesem Würfel alle Augenzahlen mit der gleichen Wahrscheinlichkeit 16 auftreten?)

p-Wertp=0.1607.

Ausgehend davon, dass der Würfel tatsächlich alle Zahlen mit gleicher Wahrscheinlichkeit zeigt (dass also

H0

gilt), ist die Wahrscheinlichkeit für die gefundenen (oder noch stärkere) Abweichungen der absoluten Häufigkeiten von den erwarteten absoluten Häufigkeiten (gemessen mit der Teststatistik

T

) also

16.07%

und ist damit so groß, dass man

H0

(zu üblichen Signifikanzniveaus) nicht ablehnen kann.

Beispiel 2

Ein Händler möchte wissen, ob die Verteilung seines Absatzes der Verteilung der Marken im Gesamtmarkt entspricht. Eine Untersuchung ergibt:

Marke12345678Summe(vermutete Wahrsch.)0.350.190.170.110.060.060.040.021(abs. Häuf.)220132967919303511622217.70118.18105.7468.4237.3237.3224.8812.44622

H0: P(M=1)=0.35, P(M=2)=0.19, P(M=3)=0.17, P(M=4)=0.11,P(M=5)=0.06, P(M=6)=0.06, P(M=7)=0.04, P(M=8)=0.02
p-Wert 𝔭=0.00855.
Falls H0 gilt, ist die Wahrscheinlichkeit für das beobachtete Ergebnis (oder eines mit einer noch höheren Teststatistik) sehr gering, nämlich nur 0.00855. Dies spricht sehr stark gegen H0. (Etwa zum Signifikanzniveau α=0.01 kann H0 abgelehnt werden.)

Anmerkungen 1

Erhält man bei einem χ2-Anpassungstest ein signifikantes Ergebnis (kleiner p-Wert bzw. Ablehung von H0), so kann man schließen, dass (vermutlich) eine Abweichung von der in der Nullhypothese angegebenen Verteilung vorliegt. Der Test macht aber zunächst keine Aussage darüber, auf welche der einzelnen Wahrscheinlichkeiten sich diese Abweichung bezieht. (Die Daten geben jedoch Hinweise darauf.)

Anmerkungen 2

Der χ2-Anpassungstest ist kein exakter Test. Das bedeutet, dass der p-Wert durch die oben angegebenen Formel näherungsweise (und nicht exakt) berechnet wird. Dieser Test sollte nur verwendet werden, wenn gewisse Mindestgrößen für die erwarteten absoluten Häufigkeiten vorliegen (dann sind die Näherungen gut genug). Als Faustregel findet man (unter anderem), dass alle npk größer oder gleich 1 und mindestens 80% der npk größer oder gleich 5 sein müssen.

Anmerkungen 3

Die Funktion chisq.test gibt eine Warnung aus, wenn nicht alle npk größer oder gleich 5 sind. In diesem Fall sollte man also dem Testergebnis nicht zu sehr vertrauen (selbst bei einem signifikanten Ergebnis). Es bieten sich dann etwa folgende Möglichkeiten:

  • n erhöhen und damit erreichen, dass npk5 für alle k=1,,m ist
  • mehrere Werte von k zusammenfassen, dies entspricht der Bildung von ’Klassen’ (s.u.), dabei gehen allerdings Teile der Informationen verloren
  • ein anderes (exaktes) Testverfahren benutzen
Aufgabe 1

An einer Uni gibt es die vier Fächer A, B, C und D. Insgesamt studieren

44%

der Studierenden Fach A,

35%

der Studierenden Fach B,

13%

der Studierenden Fach C und

8%

der Studierenden Fach D. An einem Sportkurs nehmen

80

Studierende teil, davon

28

mit Fach A,

35

mit Fach B,

14

mit Fach C und

3

mit Fach D. Überprüfen Sie anhand dieser Daten die Nullhypothese, dass das Interesse an dem Sportkurs bei den Studierenden der verschiedenen Fächer gleich groß  ist.

Aufgabe 2

Ein Tierbestand wird auf Präverenzen hinsichtlich der Aufenthaltswahrscheinlichkeit untersucht. Dazu wurde ein Gebiet in 6 unterschiedlich große Bereiche, in denen eine unterschiedliche Nahrungszusammensetzung für die Tiere gegeben sind, aufgeteilt und die Tiere in jedem der Bereiche gezählt. Man erhält:

Bereich123456SummeFläche in km210202010151590Anzahk Tiere 346052142426210

Untersuchen Sie, ob die Daten belegen, dass die Nahrungszusammensetzung dafür sorgt, dass sich die Tiere in manchen Bezirken grundsätzlich gerner aufhalten als in anderen.

Variante des Χ²-Anpassungstest für stetige Verteilungen:

Für eine ZV, bei der unendlich viele reelle Zahlen als Werte möglich sind, kann man auch einen χ2-Anpassungstest verwenden. Man muss allerdings vorab den Bereich der möglichen Werte (recht willkürlich) in verschiedene Klassen A1,,Am unterteilen. Getestet werden können Nullhypothesen, die besagen, dass eine bestimmte (vollständig festgelegte) Verteilung vorliegt.

Voraussetzung und Hypothesenpaar

Voraussetzung: X eine beliebige (diskrete oder) stetige ZV

Hypothesenpaar: H0: X ist nach 𝒱-verteilt H1: X ist nicht nach 𝒱-verteilt
(Hierbei ist 𝒱 eine bestimmte (zu prüfende) Verteilung mit bestimmten vorgegebenen Parametern.)

Beispiel

Mögliche Nullhypothesen könnten sein:

  • H0: X ist normalverteilt mit μ=120 und σ=15
  • H0: X ist exponentialverteilt mit λ=0.0023
Vorüberlegung

Vorüberlegung: Man teilt (vor einem Blick auf die Daten) den Bereich der möglichen Werte von X in verschiedene (überschneidungsfreie) Klassen A1,,Am ein und berechnet für jede der Klassen Ak die sogenannte Klassenwahrscheinlichkeit pk=P(XAk), dass X einen Wert aus dieser Klasse annimmt, falls H0 gilt. (Dazu benötigt man theoretische Kenntnisse über die Verteilung 𝒱 und verwendet Methoden aus der Wahrscheinlichkeitsrechnung, siehe Kapitel 4.)

Vorliegende Daten und Teststatistik

Vorliegende Daten: Stichprobe x1,,xn der Länge n
Daraus ermittelt man die absoluten Klassenhäufigkeiten h(ak)=hk=Anzahl der j mit xjAk(k=1,,m)

Teststatistik: T=k=1m(hknpk)2npk (hohe Werte von T sprechen gegen H0)


p-Wert zu konkreter Teststatistik T: 𝔭=1Sm1(T)=1pchisq(T,m1)
Dabei bezeichnet Sm1 die Verteilungsfunktion einer χ2-Verteilung mit m1 FG.

Beispiel 1.1

Man möchte testen, ob eine ZV normalverteilt mit μ=100 und σ=20 sein könnte und betrachtet dazu die Nullhypothese: H0: X ist normalverteilt mit μ=100 und σ=20
Der Bereich der möglichen Werte (also ],[) wird wie folgt in Klassen eingeteilt: A1=],80[,A2=[80,92[,A3=[92,100[,
A4=[100,108[,A5=[108,120[,A6=[120,[
Die Klassenwahrscheinlichkeiten berechnen sich nun wie folgt (vergleiche Normalverteilte ZV ):

Beispiel 1.2

p1=P(XA1)=0.1587p2=P(XA2)=0.1859p3=P(XA3)=0.1554p4=P(XA4)=0.1554p5=P(XA5)=0.1859p6=P(XA6)=0.1587

Beispiel 1.3

Nun wird die folgende Stichprobe ermittelt (n=80):

104.0, 98.6, 125.4, 127.1, 125.4, 70.9, 96.1, 80.6, 92.3, 97.3, 73.4, 102.7, 134.5, 87.4,
120.1, 95.0, 89.7, 116.1, 119.1, 107.6, 103.8, 99.3, 138.7, 60.8, 77.5, 93.3, 95.9, 89.3,
146.2, 73.5, 100.5, 104.7, 47.7, 93.1, 113.6, 89.0, 122.5, 51.0, 88.0, 99.6, 98.3, 98.2,
86.1, 115.1, 103.4, 73.8, 77.2, 118.2, 78.9, 130.7, 112.5, 88.5, 115.8, 116.3, 107.7, 118.3,
128.7, 114.9, 95.7, 131.1, 111.0, 72.1, 113.3, 84.4, 82.6, 86.6, 106.2, 148.0, 110.3, 108.5,
96.7, 125.6, 71.1, 97.0, 114.9, 56.8, 74.3, 98.9, 104.9, 122.0

p-Wert 𝔭=0.7341.
Die Daten sind also mit der Nullhypothese vereinbar. (Es liegt kein signifikantes Ergebnis vor.)

Anmerkungen 1

Die Wahl der Klassen kann das Testergebnis beeinflussen. Daher müssen die Klassen schon vor der Datenerhebung festgelegt werden. Darüber hinaus gibt es keine festen Regeln für die Einteilung der Klassen. Es macht meist Sinn, die Klassen als Intervalle zu wählen und darauf zu achten, dass die unter H0 erwarteten Klassenhäufigkeiten in etwa gleich groß und allesamt größer oder gleich 5 sind. Auf jeden Fall sollte man vor der Durchführung eines Tests sorgfältig über die Wahl der Klassen nachdenken.

Anmerkungen 2

Bei dem angegebenen Verfahren wird das Testergebnis durch die exakten Werte der Stichprobe nicht beeinflusst, lediglich die Klassenhäufigkeiten sind von Bedeutung (Teile der vorhanden Informationen werden nicht genutzt). Genau genommen entspricht dies nicht einem Test der Nullhypothese
H0: X ist nach 𝒱 verteilt (𝒱 bezeichne eine bestimmte Verteilung)
sondern von
H0: P(XAk)=P(eine nach 𝒱 verteilte ZV liegt in Ak)
für alle k=1,,m

Anmerkungen 3

Damit kann der Test Abweichungen von der hypothetischen Verteilung 𝒱, die die Klassenwahrscheinlichkeiten nicht beeinflussen, nicht aufdecken.

Variante des Χ²-Anpassungstest zum Testen auf die Art der Verteilung:

Will man lediglich testen, dass eine bestimmte Verteilungsart vorliegt, so kann man den oder die unbekannten Parameter schätzen und dann einen Anpassungstest wie oben durchführen. In diesem Fall verringert sich die Zahl der Freiheitsgrade um die Anzahl der geschätzten Parameter, man benutzt also die χ2-Verteilung Smg1, wobei m die Zahl der Klassen und g die Zahl der geschätzten Parameter ist.

Beispiel 1.1

Es soll überprüft werden, ob die ’Lebensdauer’ X von Seifenblasen (in Sekunden) exponentialverteilt ist (das hieße, die Wahrscheinlichkeit, dass eine Blase im kommenden Zeitraum platzt, ändert sich nicht, wenn die Blase eine Zeitlang ’überlebt’ hat). Man formuliert dazu die Nullhypothese
H0: X ist exponentialverteilt (mit irgendeinem Parameter λ)
und legt die Klassen wie folgt fest: A1=[0,6[,A2=[6,10[,A3=[10,15[,A4=[15,[ Zur Berechnung der Klassenwahrscheinlichkeiten unter H0 (und damit der erwarteten Klassenhäufigkeiten) muss der Parameter λ geschätzt werden.

Beispiel 1.2

Man testet nun n=40 Seifenblasen und bestimmt die folgenden Zeiten bis zum Zerplatzen: 16.2 , 7.5 , 13.0 , 7.4, 13.8 , 6.0 , 52.8 , 6.7, 35.1 , 6.5 , 3.5 , 8.1, 15.2 , 14.0 , 47.0, 2.7 , 10.4 , 11.5 ,
24.8 , 5.6 , 34.1, 17.2 , 19.3 , 13.6, 12.9 , 12.7, 25.6, 24.3 , 0.4 , 10.8, 28.1, 25.2 , 11.6, 5.2 , 4.5 , 3.7,
4.2 , 7.9, 6.9 , 25.8

Die Zahl der Freiheitsgrade für die χ2-Verteilung ergibt sich als
Zahl der KlassenZahl der geschätzten Parameter1=
 411=2
und somit ergibt sich der p-Wert als 𝔭=0.0626

Aufgabe

An einer Kreuzung wird mehrfach die Zeit zwischen zwei Unfällen festgestellt. Es ergeben sich die folgenden Daten (gemessen in Tagen): 12,2,62,31,89,6,32,12,5,177.
Führen Sie einen χ2-Anpassungstest erst für vermutete (aufgrund theoretischer Üerlegungen) und dann für geschätze Paramter durch. Wählen Sie die Klassengrenzen und α selbst.
Anmerkung: Diese Aufgabe ist bewusst sehr offen gestellt - entscheiden Sie selbst!

Χ²-Homogenitätstest:

Mit einem χ2-Homogenitätstest kann für zwei diskrete oder stetige ZV getestet werden, ob sie diesselbe Verteilung haben könnten.

Χ²-Homogenitätstest für diskrete Verteilungen

Voraussetzung und Hypothesenpaar

Voraussetzung: X,Y diskrete ZV mit denselben möglichen Werten a1,,am

Hypothesenpaar: H0: P(X=a1)=P(Y=a1) , , P(X=am)=P(Y=am) H1:P(X=ak)=P(Y=ak) für mindestens ein k{1,,m}

oder

H0:XundY haben diesselbe Verteilung
H1:Die Verteilungen vonXundY unterscheiden sich.

Vorliegende Daten

Vorliegende Daten: Unabhängige Stichproben x1,,x(h(X)) von Xundy1,,y(h(Y)) von Y
Daraus ermittelt man die absoluten Häufigkeiten h(X)(ak)=hk(X)=Anzahl der j{1,,h(X)} mit xj=akh(Y)(ak)=hk(Y)=Anzahl der j{1,,h(Y)} mit yj=ak
für k=1,,m. Oft fasst man diese in einer sogenannten Kontingenztabelle zusammen, dabei entspricht h(X) der absoluten Häufigkeit aller Ausprägungen der Stichprobe von X, was gerade die Stichprobenlänge von X ist:
a1a2amgesamtXh1(X)h2(X)hm(X)h(X)Yh1(Y)h2(Y)hm(Y)h(Y)gesamth1=h1(X)+h1(Y)h2=h2(X)+h2(Y)hm=hm(X)+hm(Y)n=h(X)+h(Y)

Teststatistik

Teststatistik: T=k=1m(hk(X)h(X)hkn)2h(X)hkn + k=1m(hk(Y)h(Y)hkn)2h(Y)hkn=iX,Yk=1m(hk(i)h(i)hkn)2h(i)hkn
(hohe Werte von T sprechen gegen H0)
Idee: Die Idee dabei ist, dass man im Falle der Gültigkeit von H0 annehmen kann, dass die relativen Häufigkeiten von ak bei X und Y nahe bei der gesamten relativen Häufigkeit von ak sind, das heißt dass hk(X)h(X)hknundhk(Y)h(Y)hkn
zu erwarten ist, wenn H0 gilt. Dies hätte dann zur Folge, dass die bei der Berechnung von T auftretenden Quadrate (und damit auch T selbst) eher kleine Werte annimmt, wenn H0 gilt. Also spricht ein hoher Wert von T gegen H0.

p-Wert

p-Wert zu konkreter Teststatistik T: 𝔭=1Sm1(T)=1pchisq(T,m1)
Dabei bezeichnet Sm1 die Verteilungsfunktion einer χ2-Verteilung mit m1 FG.

Durchführung mit R

Man kann diesen Test in R mit chisq.test(h) durchführen. Dabei muss h eine Matrix (mit 2 Zeilen und m Spalten) sein, deren Einträge mit denen der Kontingenztabelle übereinstimmen (d.h. in der ersten Zeile von h befinden sich die Werte h1(X),,hm(X) und in der zweiten Zeile die Werte h1(Y),,hm(Y).)
Man erreicht dies zum Beispiel mit: h<-matrix(c(h1(X),,hm(X),h1(Y),,hm(Y)),nrow=2,ncol=m,byrow=TRUE)

Beispiel 1.1

Es soll untersucht werden, ob Frauen und Männer das gleiche Wahlverhalten zeigen. Zu den 5 zur Auswahl stehenden Parteien wurden 120 Frauen und 100 Männer befragt. Es ergab sich folgende Kontingenztabelle:
Partei 1Partei 2Partei 3Partei 4Partei 5gesamtHLINE TBDFrauenh1(X)=50h2(X)=34h3(X)=9h4(X)=18h5(X)=9h(X)=120Männerh1(Y)=31h2(Y)=26h3(Y)=21h4(Y)=12h5(Y)=10h(Y)=100gesamth1=81h2=60h3=30h4=30h5=19n=220

Beispiel 1.2

Man berechnet nun die Teststatistik und den p-Wert 𝔭=0.0432. Dies ist also ein signifikantes Ergebnis (zum Signifikanzniveau α=0.05) und damit ist die Gegenhypothese
H1: Männer und Frauen wählen unterschiedlich.
mit den Daten vereinbar.

Anmerkungen I

Falls X und Y stetige ZV sind, kann man den χ2-Homogenitätstest immer noch durchführen, wenn man die Menge der möglichen Werte der beiden ZV vor der Datenerhebung in Klassen A1,,Am aufteilt und dann die absoluten Klassenhäufigkeiten hk(X)=Anzahl der j{1,,h(X)} mit xjAkund
hk(Y)=Anzahl der j{1,,h(Y)} mit yjAk
für k=1,,m in die Kontingenztabelle einträgt.

Anmerkungen II

Man beachte dabei, dass die Wahl der Klassen das Testergebnis beeinflussen kann und dass der Test bestimmte Unterschiede in den Verteilungen von

X

und

Y

nicht mehr aufdecken kann, genau genommen untersucht man nun statt der Nullhypothese

H0: XundYhaben dieselbe Verteilung


die veränderte Nullhypothese

H0: P(XAk)=P(YAk)für alle k=1,,m

Beispiel 1.1

Zwei Maschinen X und Y sollen Kaffee in Päckchen mit je 500 g abfüllen. Es soll festgestellt werden, ob beide Maschinen gleich arbeiten, dazu sollen 60 Päckchen von X und 40 Päckchen von Y untersucht werden. Man bildet (zum Beispiel) die folgenden Klassen A1=[0,496[,A2=[496,498[,A3=[498,499[,A4=[499,500[, A5=[500,501[,A6=[501,502[,A7=[502,504[,A8=[504,[ und betrachtet dann die Stichproben. Es ergeben sich die folgenden Werte für die Gewichte der einzelnen Päckchen:

Beispiel 1.2

Für X:502.16, 498.67, 499.66, 499.71, 497.53, 499.28, 499.47, 499.42, 499.72, 500.25,
502.77, 501.59, 501.65, 502.12, 496.87, 501.37, 499.03, 494.84, 500.33, 500.02,
497.19, 498.35, 502.10, 501.12, 497.78, 501.85, 498.44, 498.80, 501.14, 501.90,
500.44, 499.73, 501.73, 499.16, 498.91, 500.91, 503.25, 499.45, 502.89, 498.39,
498.66, 502.23, 499.31, 500.63, 501.31, 499.94, 504.43, 496.44, 500.84, 504.07,
502.06, 495.90, 502.77, 498.20, 497.09, 499.81, 501.17, 503.97, 498.50, 499.67


Für Y:491.33, 491.67, 493.52, 494.81, 495.42, 495.76, 496.43, 496.67, 497.88, 498.72,
499.19, 499.21, 499.33, 499.36, 499.38, 499.40, 499.61, 499.63, 500.21, 500.30,
500.43, 500.90, 500.92, 500.99, 501.28, 501.49, 501.50, 501.78, 502.41, 502.65,
503.02, 503.07, 503.56, 503.84, 504.00, 504.19, 504.82, 505.12, 505.21, 507.54

p-Wert: 𝔭=1S81(T)=0.0671


Die Nullhypothese:

H0

:

X

und

Y

sind identisch verteilt. kann also zum Signifikanzniveau

α=0.1

abgelehnt werden, nicht jedoch für

α=0.05

.

Beispiel 1.3

Ein zweiseitiger Zwei-Stichproben-t-Test (Welch-Test) zur Nullhypothese
H0:μX=μY

liefert einen

p

-Wert von

0.9411

. (Die empirischen Mittelwerte

X=500.1165

und

Y=500.1637

unterscheiden sich auch nicht sehr stark.) Der Unterschied zwischen den beiden Verteilungen scheint also eher nicht an ihren Erwartungswerten zu liegen.

Anwendbarkeit

Da die Teststatistik nur approximativ χ2-verteilt ist, kann der Test nur angewendet werden, wenn die unter H0 erwarteten absoluten Häufigkeiten h(X)hkn und h(Y)hkn groß genug sind (Regel: alle 1 und mindestens 80% davon 5). Sind sie nicht alle 5, so erhält man bei Anwendung der Funktion chisq.test eine Warnung.

Aufgabe 1

In einer Studie soll auf Unterschiede in zwei Habitaten X und Y in Bezug auf die Zusammensetzung der Ameisenpopulation untersucht werden. Dazu wird in beiden Habitaten eine Falle aufgestellt und die Anzahl der darin gefangenen Individuen der jeweiligen Ameisenarten gezählt:

AmeisenartABCDAnzahl in Habitat X513212190364Anzahl in Habitat Y23693105196

Untersuchen Sie mit einem χ2- Homogenitätstest, ob die Habitate einen Einfluss auf die Zusammensetzung der Ameisenpopulationen haben.

Aufgabe 2

Kuss et al. (The fouled player should not take the penalty himself: An empirical investigation of an old German football myth, J. Sports Sciences 25, no. 9, 963967, 2007) berichten über die Elfmeter in der 1. Fußballbundesliga (der Herren) von August 1993 bis Februar 1995. Es wurde festgestellt, dass von 92 Elfmetern, bei denen der Gefoulte selbst geschossen hatte, 74 verwandelt wurden. Von 733 Elfmetern, bei denen der Gefoulte nicht selbst geschossen hatte, wurden 547 verwandelt. Stützen diese Daten die These, dass der Gefoulte den Elfmeter nicht selbst schießen sollte ?

Aufgabe 3

Betrachten Sie erneut die beiden Abfüllanlagen für Kaffee mit den ZV X und Y. Prüfen Sie erneut mit vier Klassen, ob die gleiche Verteilung vor liegt. Verwenden Sie die Daten aus dem R-Skript datenUEB10.r von GitHub.

Verfahren für mehrere ZV 1

Das Verfahren lässt sich leicht für drei oder mehr ZV X(1),,X(l) verallgemeinern. Liegen Stichproben vor, anhand derer man eine Kontingenztabelle
a1a2amgesamtX(1)h1(1)h2(1)hm(1)h(1)X(2)h1(2)h2(2)hm(2)h(2)X(l)h1(l)h2(l)hm(l)h(l)gesamth1h2hmn

aufstellen kann, so testet man die Nullhypothese
H0: Die ZVX(1),X(l) haben alle die gleiche Verteilung.

Verfahren für mehrere ZV 2

mit der Teststatistik
T=i=1lk=1m(hk(i)h(i)hkn)2h(i)hkn

Diese ist χ2-verteilt mit (m1)(l1) Freiheitsgraden, man berechnet den p-Wert durch 1S(m1)(l1)(T).

Man kann dies in R (wie im Fall l=2, siehe oben) mit chisq.test(h) tun, wobei die Matrix h, die der Kontingenztabelle entspricht, diesmal eine Matrix mit l Zeilen und m Spalten sein muss.

Aufgabe

An drei Schulen wird eine Vergleichsarbeit geschrieben. Dabei ergeben sich die folgenden Notenspiegel:
Note123456Anzahl Schüler in Schule 1711201771Anzahl Schüler in Schule 2417301751Anzahl Schüler in Schule 371924763

Untersuchen Sie mit einem χ2- Homogenitätstest, ob diese Daten belegen, dass es an den Schulen signifikante Unterschiede bezüglich der Wahrscheinlichkeitsverteilung für die verschiedenen Noten gibt.

Χ²-Unabhängigkeitstest für diskrete oder stetige Verteilungen

Mit einem χ2-Unabhängigkeitstest kann für zwei diskrete oder stetige ZV anhand verbundener Stichproben getestet werden, ob sie unabhängig voneinander sein könnten.
(Mathematisch unterscheidet sich diese Variante nicht von dem zuvor behandelten Homogenitätstest für zwei oder mehr unabhängige ZV. In Bezug auf Anwendungsbezug, Formulierung und Interpretation bestehen aber Unterschiede, die wir hier behandeln wollen.)

Voraussetzung und Hypothesenpaar

Voraussetzung:
X diskrete oder stetige ZV mit den möglichen Werten a1,,am oder den Klassen A1,,Am
Y diskrete oder stetige ZV mit den möglichen Werten b(1),,b(l) oder den Klassen B1,,Bl
Hypothesenpaar: H0:XundYsind unabhängig voneinander  H1:XundYsind nicht unabhängig voneinander

Vorliegende Daten

Vorliegende Daten: Verbundene Stichproben (x1,y1),(xn,yn) von X und Y

Daraus bestimmt man die gemeinsamen absoluten Häufigkeiten
hk(i)=Anzahl der j mit xj=ak( bzw. xjAk) und  yj=b(i)( bzw. yjBi) für (k=1,,m, i=1,,l)
und trägt sie in eine Kontingenztabelle ein:
a1a2amgesamtb(1)h1(1)h2(1)mk(1)h(1)=k=1mhk(1)b(2)h1(2)h2(2)hm(2)h(2)=k=1mhk(2)b(l)h1(l)h2(l)hm(l)h(l)=k=1mhk(l)gesamth1=i=1lh1(i)h2=i=1lh2(i)hm=i=1lhm(i)n

Teststatistik

Teststatistik: T=i=1lk=1m(hk(i)hkh(i)n)2hkh(i)n(hohe Werte von T sprechen gegen H0)
Idee: Falls H0 gilt, erwartet man, dass die entsprechende Tabelle der relativen Häufigkeiten mit hoher Wahrscheinlichkeit in etwa eine Multiplikationstabelle ist, d.h. dass
hk(i)nhknh(i)nhk(i)hkh(i)n
für alle auftretenden Paare (k,i) gilt. (Man schreibt manchmal auch h~k(i)=hkh(i)n und nennt dies die unter H0 erwartete absolute Häufigkeit von ak für X und b(i) für Y.)

p-Wert

p-Wert zu konkreter Teststatistik T:
𝔭=1S(m1)(l1)(T)=1pchisq(T,(m1)*(l1))
Dabei bezeichnet Sm1 die Verteilungsfunktion einer χ2-Verteilung mit m1 FG.

Durchführung mit R

Dies geht völlig analog zum Fall der Homogenitätshypothese (siehe oben) mit chisq.test(h), falls h die Matrix entsprechend der Kontingenztabelle (l Zeilen, m Spalten) ist.

Beispiel 1.1

In einem Leichtathletikverein werden die Leistungen im Kugelstoßen und im 100 Meter-Lauf untersucht. Man teilt die möglichen Zeiten und Weiten in Klassen ein, erfasst die Leistungen von n=100 Sportlern und stellt die absoluten Klassenhäufigkeiten in der Kontingenzabelle zusammen:
Kugelstoßen100m-LaufA1=[0,8[A2=[8,12[A3=[12,[gesamtB1=[0,11[h1(1)=3h2(1)=6h3(1)=1h(1)=10B2=[11,11.5[h1(2)=4h2(2)=8h3(2)=7h(2)=19B3=[11.5,12.5[h1(3)=15h2(3)=22h3(3)=12h(3)=49B4=[12.5,[h1(4)=6h2(4)=11h3(4)=5h(4)=22gesamth1=28h2=47h3=25n=100

Beispiel 1.2

Also ergibt sich der p-Wert zur Unabhängigkeitshypothese als 𝔭=0.8055 und damit kann sie nicht abgelehnt werden. Allerdings sind hier einige (3 von 12) erwartete absolute Häufigkeiten kleiner als 5 und damit ist die Approximation der Verteilung von T durch die χ2-Verteilung möglicherweise zu ungenau.

Abschließende Bemerkungen zu den Χ²-Tests

Zum Abschluss dieses Abschnitts noch einige Anmerkungen zu Vor- und Nachteilen von χ2-Tests.

Vorteile:

  • Die Tests sind vielseitig einsetzbar (viele verschiedenartige Nullhypothesen können damit getestet werden).
  • Die Idee ist (relativ) leicht verständlich.
  • Die Tests sind verteilungsfrei, d.h. es muss nicht vorausgesetzt werden, dass eine bestimmte Verteilungsart vorliegt. Insbesondere bei diskreten Verteilungen werden diese Tests daher oft verwendet.
  • R (und andere Statistik-Software-Pakete) haben die Tests implementiert.

Nachteile 1

  • Bei stetigen ZV beeinflusst die (willkürliche) Bildung der Klassen das Testergebnis. Diese kann auch dazu führen, dass bestimmte Abweichungen von der Nullhypothese vom Test nicht mehr aufgedeckt werden können.
  • Für zu kleine Stichproben (genauer: für zu kleine erwartete absolute Häufigkeiten) können die Tests nicht angewendet werden, da dann die näherungsweise Berechnung des p-Werts nicht genau genug ist. Man sollte dann auf ’exakte’ Tests zurückgreifen (z.B. Fisher-Test auf Unabhängigkeit).

Nachteile 2

  • Ein direkter Vergleich mehrerer Testverfahren bezüglich der Güte (Teststärke) liefert meist kein eindeutiges Ergebnis, da verschiedene Abweichungen von der Nullhypothese denkbar sind und mit bestimmten Tests manche davon ’besser’ und andere ’schlechter’ vom Test angezeigt werden, d.h. die Wahrscheinlichkeit eines signifikanten Ergebnisses ist je nach Wahl des Testverfahrens in manchen Situationen (in denen H1 vorliegt) größer und in anderen kleiner. Es gibt jedoch (je nach Nullhypothese) insbesondere für stetige Verteilungen sinnvolle Alternativen zum χ2-Test, die ’in den meisten Fällen’ mit höherer Wahrscheinlichkeit ein signifikantes Ergebnis liefern (also eine bessere Güte bzw. höhere Teststärke haben).

Seiteninformation

Diese Lernresource können Sie als Wiki2Reveal-Foliensatz darstellen.

Wiki2Reveal

Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Kurs:Statistik für Anwender' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.