Kurs:Statistik für Anwender/Tests zur Binomialverteilung

Aus testwiki
Zur Navigation springen Zur Suche springen

Tests zur Binomialverteilung

Situation

Die Trefferwahrscheinlichkeit p einer Binomialverteilung ist unbekannt.
Wir betrachten in diesem Kapitel einige Nullhypothesen bezüglich p (einseitige und zweiseitige Tests) und erklären jeweils die Berechnung des p-Werts. Alle Verfahren basieren dabei auf der Trefferzahl T=k bei n Versuchen.

Linksseitiger Test

Voraussetzung, Hypothesenpaar, Teststatistik

Voraussetzung: T binomialverteilt mit Versuchszahl n und Trefferwahrscheinlichkeit p=?

Hypothesenpaar: H0:pp0 und H1:p<p0 (linksseitiger Test)
(Dabei ist p0(0,1) vorgegeben.)

Vorliegende Daten: Trefferzahl T=T(k)=k

Teststatistik: Trefferzahl T (niedrige Werte von T sprechen gegen H0)

p-Wert und Ablehnbereich

p-Wert zu konkreter Trefferzahl T=k :
𝔭=j=0k(nj)p0j(1p0)nj=pbinom(k,n,p0)

Ablehnbereich bei gegebenem Signifikanzniveau α: A={T=k; j=0k(nj)p0j(1p0)njα}={0,,kmax}

Durchführung mit R: binom.test(k,n,p0,"less ")

Beispiel linksseitiger Test I

Die Nullhypothese besagt, dass ein Medikament in mindestens 70% aller Fälle eine Nebenwrkung auftritt, also H0:pp0=0.7

  • Um die Nullhypothese zu testen, legt man ein Signifikanzniveau α=0.05 fest und beobachtet 100 Patienten, die das Medikament einnehmen. Die Wirkung tritt in 64 Fällen ein. Reicht dies aus, um die Nullhypothese abzulehnen? p0=0.7, n=100, T=k=64 p-Wert: 𝔭=0.1161>α
    Folglich kann die Nullhypothese nicht abgelehnt werden. (Sie könnte allerdings trotzdem falsch sein, allerdings rechtfertigen die Daten keine Ablehnung zum gegebenen Signifikanzniveau.)

Beispiel linksseitiger Test II
  • Angenommen die Nebenwirkung wäre bei nur 59 Patienten eingetreten. In diesem Fall p0=0.7, n=100, T=k=59 p-Wert: 𝔭=0.0125α
    Die Nullhypothese kann nun also abgelehnt werden. Sie könnte dennoch gelten, aber wir wissen: Wenn H0 gilt, ist eine Ablehnung unwahrscheinlich (genauer: P(Ablehung)α=0.05). Eine Ablehung spricht daher gegen H0.

  • Man stellt bei α=0.05 fest: A={0,,61}

Rechtsseitiger Test

Voraussetzung, Hypothesenpaar, Teststatistik

Voraussetzung: T binomialverteilt mit Versuchszahl n und Trefferwahrscheinlichkeit p=?

Hypothesenpaar: H0:pp0 und H1:p>p0 (rechtsseitiger Test)
(Dabei ist p0(0,1) vorgegeben.)

Vorliegende Daten: Trefferzahl T=T(k)=k

Teststatistik: Trefferzahl T (hohe Werte von T sprechen gegen H0)

p-Wert und Ablehnbereich

p-Wert zu konkreter Trefferzahl T=k :
𝔭=j=kn(nj)p0j(1p0)nj=1pbinom(k1,n,p0)

Ablehnbereich bei gegebenem Signifikanzniveau α: A={T=k; j=kn(nj)p0j(1p0)njα}={kmin,,n}

Durchührung mit R: binom.test(k,n,p0,alt=" greater ")

Beispiel rechtsseitiger Test I

Die Nullhypothese besagt, dass nach Kalkeinsatz mit einer Wahrscheinlichkeit von höchstens 80% eine bestimmte Verbesserung des Waldbodens eintritt, also: H0:pp0=0.8

  • Um die Nullhypothese zu testen, legt man ein Signifikanzniveau α=0.1 fest und führt 20 Kalkeinsätze durch. Die Wirkung tritt in k=18 Fällen ein. Es gilt: p0=0.8, n=20, k=18
    pWert: 𝔭=0.206

  • Also gilt zum Signifikanzniveau α=0.1: A={19,20}

Beispiel rechtsseitiger Test II

  • Hätte man das Signifikanzniveau auf 0.01 festgelegt, so hätte dieser Nachweis selbst bei 20 (von 20) Treffern nicht gelingen können, denn es gilt p0=0.8, n=20, k=20
    pWert: 𝔭=0.012>0.01

Beispiel rechtsseitiger Test III

  • Man hätte auch die Nullhypothese H0:p0.8 betrachten können:

    Hierbei hätte man (wie in 1.) erklärt) zum Signifikanzniveau α=0.1 erhalten: A={0,,13}

  • Wir haben festgestellt: Liegt die Trefferzahl zwischen 14 und 18, so kann man weder die Nullhypothese p0.8 noch die Nullhypothese p0.8 (zum Signifikanzniveau α=0.1) ablehnen. In diesem Fall reichen die Daten (Trefferzahl) nicht aus, um (mit einer Irrtumswahrscheinlichkeit von nicht mehr als 0.1) zu entscheiden, ob p0.8 oder p0.8 ist.

Zweiseitiger Test

Wir betrachten nun das Hypothesenpaar: H0:p=p0undH1:p=p0(p0(0,1)vorgegeben)

An diesem Fall soll verdeutlicht werden, dass es bisweilen mehrere sinnvolle Testverfahren gibt, die unterschiedliche Ergebnisse liefern können.

Klar ist hier: Die Nullhypothese sollte sowohl für zu kleine und auch für zu große beobachtete Trefferzahlen abgelehnt werden.

Anmerkung

Zu einer seriösen Vorgehensweise gehört es, sich vor der Datenerhebung auf ein Testverfahren festzulegen (und nicht im Nachhinein ein Testverfahren auszuwählen, dass bei den vorliegenden Daten einen möglichst kleinen p-Wert hat, um so ein signifikantes Ergebnis zu erhalten).

1. Methode:

Voraussetzung und Hypothesenpaar

Voraussetzung: T binomialverteilt mit Versuchszahl n und Trefferwahrscheinlichkeit p=?

Hypothesenpaar: H0:p=p0 und H1:p=p0

Vorliegende Daten: Trefferzahl T=T(k)=k

Teststatistik und p-Wert

Teststatistik: S=S(k)=|knp0| (hohe Werte von S sprechen gegen H0)
Idee: Falls H0 gilt, ist p=p0 und damit ist E(T)=p0n. Die Teststatistik S gibt die Abweichung der Trefferzahl von ihrem Erwartungswert (unter H0) an.

p-Wert zu konkreter Teststatistik S : 𝔭=P(SS)=j,S(j)S(nj)p0j(1p0)nj=j,S(j)SP(T=j)

S ist dabei ebenfalls eine Zufallsvariable, welche mit S(j)=|jnp0| konkrete Realisierungen für jede mögliche Trefferzahl j{0,,n} annimmt.

Beispiel 1. Methode I

Wir führen dies am Beispiel n=36, p0=0.85 durch. Die verschiedenen Trefferzahlen j{0,,36} haben die folgenden Teststatistiken:

j012345678910S(j)30.629.628.627.626.625.624.623.622.621.620.6j1011121314151617181920S(j)20.619.618.617.616.615.614.613.612.611.610.6j2021222324252627282930S(j)10.69.68.67.66.65.64.63.62.61.60.6j30313233343536S(j)0.60.41.42.43.44.45.4

Beispiel 1. Methode II

Damit erhält man (exemplarisch) die folgenden p-Werte:

  • Angenommen es ergibt sich die Trefferzahl T=k=0. Dann ist S=30.6. Der p-Wert berechnet sich als Wahrscheinlichkeit (unter der Annahme, dass H0 wahr ist, also tatsächlich p=0.85 gilt):
    P(S(j)30.6)=21030

  • Angenommen es ergibt sich die Trefferzahl T=k=25. Dann ist S=5.6. Der p-Wert berechnet sich als Wahrscheinlichkeit (unter der Annahme, dass H0 wahr ist, also tatsächlich p=0.85 gilt):
    P(S5.6)=0.014

Beispiel 1. Methode III
  • Angenommen es ergibt sich die Trefferzahl T=k=28. Dann ist S=2.6. Der p-Wert berechnet sich als Wahrscheinlichkeit (unter der Annahme, dass H0 wahr ist, also tatsächlich p=0.85 gilt):
    P(S2.6)=0.240

  • Angenommen es ergibt sich die Trefferzahl T=k=31. Dann ist S=0.4. Der p-Wert berechnet sich als Wahrscheinlichkeit (unter der Annahme, dass H0 wahr ist, also tatsächlich p=0.85 gilt):
    P(S0.4)=1

Beispiel 1. Methode IV

Mit dieser Methode kann zu jeder Trefferzahl der p-Wert bestimmt werden.

H0 wird genau dann abgelehnt, wenn der p-Wert α ist. Bei α=0.05 ist dies für T=k{0,,26 , 36}=AMethode 1 der Fall.


Der p-Wert entspricht damit der Wahrscheinlichkeit (bei Gültigkeit von H0), dass beobachtete Ergebnis oder ein im Hinblick auf H0 noch extremeres Ergebnis zu erhalten. Bei dieser Methode wurde eine Trefferzahl als extrem angesehen, wenn sie stark vom Erwartungswert (unter H0) abweicht.

2. Methode:

Voraussetzung und Hypothesenpaar

Voraussetzung: T binomialverteilt mit Versuchszahl n und Trefferwahrscheinlichkeit p=?

Hypothesenpaar: H0:p=p0 und H1:pp0

Vorliegende Daten: Trefferzahl T=T(k)=k

Teststatistik und p-Wert

Teststatistik: S=S(k)=(nk)p0k(1p0)nk (niedrige Werte von S sprechen gegen H0)
Idee: Falls H0 gilt, ist p=p0 und damit ist P(T=k)=(nk)p0k(1p0)nk. Die Teststatistik S gibt an, wie wahrscheinlich die beobachtete Trefferzahl ist, falls H0 gilt.

p-Wert zu konkreter Teststatistik S : 𝔭=P(SS)=j,S(j)S(nj)p0j(1p0)nj=j,S(j)SP(T=j)

S ist dabei ebenfalls eine Zufallsvariable, welche mit S(j)=(nj)p0j(1p0)nj konkrete Realisierungen für jede mögliche Trefferzahl j{0,,n} annimmt.

Durchführung mit R: binom.test(k,n,p0)

Beispiel 2. Methode I
  • Betrachte: H0:p=0.4 (also p0=0.4) im Fall n=14

    Wir berechnen zunächst zu jeder möglichen Trefferzahl j den Wert S(j) (= hier Wahrscheinlichkeit für die Trefferzahl j, falls die Nullhypothese gilt):

j01234S(j)0.0007840.0073140.0316940.0845170.154948HLINE TBDj56789S(j)0.2065980.2065980.1574080.0918210.040809HLINE TBDj1011121314S(j)0.0136030.0032980.0005500.0000560.000003

Beispiel 2. Methode II

Wir berechnen nun für alle möglichen Trefferzahlen T=k den p-Wert: Trefferzahlp-WertTrefferzahlp-WertT=k=00.001392T=k=80.274449T=k=10.012004T=k=90.098111T=k=20.057301T=k=100.025607T=k=30.182628T=k=110.004690T=k=40.429397T=k=120.000609T=k=51T=k=130.000059T=k=61T=k=140.000003T=k=70.586805

Beispiel 2. Methode III
  • Betrachtet man wieder das Beispiel, dass wir mit Methode 1 schon behandelt hatten (also n=36, p0=0.85, α=0.05), so kommt man mit Methode 2 zu einer Ablehnung von H0, falls T=k{0,,25 , 35,36}=AMethode 2. (An diesem Beispiel sieht man also, dass man mit den beiden Methoden zu verschiedenen p-Werten und verschiedenen Ablehnbereichen kommen kann.)

Der p-Wert entspricht damit der Wahrscheinlichkeit (bei Gültigkeit von H0), dass beobachtete Ergebnis oder ein im Hinblick auf H0 noch extremeres Ergebnis zu erhalten. Bei diesem Test wurde eine Trefferzahl als extrem angesehen, wenn sie unwahrscheinlich ist, falls H0 gilt.

Aufgabe 1.1

Bestimmen Sie für die folgenden Nullhypothesen (bezüglich der Trefferwahrscheinlichkeit p einer Binomialverteilung) jeweils die Ablehnbereiche A zu den angegebenen Versuchszahlen n und Signifikanzniveaus α.
Wie wirkt es sich auf die Teststärke aus, wenn man die Versuchszahl erhöht bzw. das Signifikanzniveau α verringert?
(Hinweis: Geben Sie den p-Wert zuerst als Formel an, in die Sie alle bekannten Werte einsetzen.)

NullhypotheseH:p0.2 .

n=20n=200α=0.05A=A=α=0.01A=A=

Aufgabe 1.2

Nullhypothese H:p0.6 .

n=20n=200α=0.05A=A=α=0.01A=A=

Aufgabe 2.1

Berechnen Sie zu den angegebenen Nullhypothesen zur Trefferwahrscheinlichkeit p einer Binomialverteilung bei n Versuchen den p-Wert aller möglichen Trefferzahlen k{0,,n} und daraus den Ablehnbereich für die angegebenen Signifikanzniveaus. Verwenden Sie den links- und rechtsseitigen Binomialtest aus der Vorlesung.
(Hinweis: Geben Sie den p-Wert zuerst als Formel an, in die Sie alle bekannten Werte einsetzen und bestimmen Sie dann (z.B. mit R) die konkreten Werte.)

Aufgabe 2.2

NullhypotheseH:p0.5 , n=8.

k=012345678p-Wert
Signifikanzniveau α0.10.05Ablehnbereich A

Aufgabe 2.3

Nullhypothese H:p0.4 , n=10.

k=012345678910p-Wert
Signifikanzniveau α0.10.05Ablehnbereich A

Aufgabe 3.1

Berechnen Sie zu der angegebenen Nullhypothese zur Trefferwahrscheinlichkeit p einer Binomialverteilung bei n Versuchen den p-Wert aller möglichen Trefferzahlen k{0,,n} und daraus den Ablehnbereich für die angegebenen Signifikanzniveaus. Verwenden Sie den beidseitigen (Methode 1 und Methode 2) Binomialtest aus der Vorlesung. Vergleichen Sie die Ergebnisse.

(Hinweis: Geben Sie den p-Wert zuerst als Formel an, in die Sie alle bekannten Werte einsetzen und bestimmen Sie dann (z.B. mit R) die konkreten Werte.)

Aufgabe 3.2

Nullhypothese H:p=0.64, n=10.

k=012345678910p-Wert
Signifikanzniveau α0.10.05Ablehnbereich A

Seiteninformation

Diese Lernresource können Sie als Wiki2Reveal-Foliensatz darstellen.

Wiki2Reveal

Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Kurs:Statistik für Anwender' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.