Kurs:Statistik für Anwender/Hilfsmittel: Punkt- und Intervallschätzung bei stetigen ZV

Aus testwiki
Zur Navigation springen Zur Suche springen

Hilfsmittel: Punkt- und Intervallschätzung bei stetigen ZV

Motivation I

In der Praxis ist die W-Dichte einer stetigen ZV X (analog zur Wahrscheinlichkeitsverteilung einer endlichen ZV) meist nicht bekannt. Manchmal können jedoch bestimmte Annahmen sinnvoll sein, wie etwa, welcher Verteilung X (näherungsweise) genügt.

Informationen über X liegen meist in Form einer Stichprobe von n unabhängig und unter gleichen Bedingungen erhaltenen Realisationen x1,,xn vor. Anhand dieser Daten kann man nun interessierende Kennwerte der ZV X schätzen.

Motivation II

ZV X mit unbekannter W-Dichte zufällig Daten x1,,xn

methodisch Schätzung für unbekannte Parameter der ZV


Punktschätzungen - Schätzung für EW und Varianz

Sei X eine beliebige (diskrete oder stetige) ZV. Dabei sind der EW E(X) und die Varianz V(X) von X unbekannt.

  • E(X) wird geschätzt durch: x=1nj=1nxj (arithmetischer Mittelwert)
  • V(X) wird geschätzt durch: sx2=1n1j=1n(xjx)2=1n1(j=1nxj21n(j=1nxj)2)
    (empirische Varianz oder korrigierte Stichprobenvarianz)

Berechnung in R

In R berechnet man:
x mit  mean(x) und
sx2 mit  var(x) oder sd(x)^2

Erwartungstreue und Konsistenz

Diese beiden Schätzungen sind in jedem Fall erwartungstreu und konsistent:

Erwartungstreu

Die Ergebnisse der Schätzungen (also

x

und

sx2

) sind zwar vom Zufall abhängig, der erwartete Durchschnitt  der Schätzung entspricht aber dem unbekannten zu schätzenden Wert (also

E(X)

bzw.

V(X)

).

Präziser gesagt:
Vor Erhebung der Stichprobe können x=^Mn und sx2=^Vn als ZV aufgefasst werden. Dann gilt:

E(Mn)=E(X) und E(Vn)=V(X)

Konsistent

Ist n sehr groß so sind die Schätzungen mit hoher Wahrscheinlichkeit nahe am wahren Wert. Also n sehr groß

mit hoher Wahrscheinlichkeit ist xE(X) und sx2V(X)

Präziser gesagt: Vor Erhebung der Stichprobe können x=^Mn und sx2=^Vn als ZV aufgefasst werden. Dann gilt für festes c>0:
P(E(X)cMnE(X)+c)n1
und
P(V(X)cVnV(X)+c)n1

Beispiel zur Konsistenz I

Wir betrachten eine normalverteilte ZV mit σX=15 und unbekanntem Erwartungswert E(X)=μX. Dann ist der arithmetische Mittelwert x=^Mn (als ZV aufgefasst) zu einer Stichprobe der Länge n ebenfalls normalverteilt (dies wollen wir hier nicht begründen) mit μMn=μX und σMn=σXn=15n. Daraus folgt:

  • Falls n=20 ist, gilt: P(Mn[μ10,μ+10])=0.9971P(Mn[μ5,μ+5])=0.8640P(Mn[μ1,μ+1])=0.2344P(Mn[μ0.4,μ+0.4])=0.0949P(Mn[μ0.1,μ+0.1])=0.0238

Beispiel zur Konsistenz II

  • Falls n=150 ist, gilt: P(Mn[μ10,μ+10])1P(Mn[μ5,μ+5])1P(Mn[μ1,μ+1])=0.5858P(Mn[μ0.4,μ+0.4])=0.2560P(Mn[μ0.1,μ+0.1])=0.0651

Beispiel zur Konsistenz III

  • Falls n=1200 ist, gilt: P(Mn[μ10,μ+10])1P(Mn[μ5,μ+5])1P(Mn[μ1,μ+1])=0.9791P(Mn[μ0.4,μ+0.4])=0.6444P(Mn[μ0.1,μ+0.1])=0.1826

Grundlagen der Intervallschätzung

Ziel ist es nun, auch Intervallschätzungen für unbekannte Parameter von stetigen ZV anzugeben. Dazu benötigen wir Kenntnisse über einige weitere Verteilungen (t-Verteilung und χ2-Verteilung), die üblicherweise nicht direkt als Modell für ein ZE verwendet werden. Sie treten aber bespielsweise auf, wenn man stetige ZV auf geeignete Art und Weise verknüpft und werden daher bei der Berechnung von Konfidenzintervallen für die Parameter dieser Verteilungen benötigt.

In diesem Abschnitt wollen wir diese Verteilungen definieren und ihre wichtigsten Eigenschaften zusammenfassen. Als weiteres Hilfsmittel brauchen wir dazu die Gamma-Funktion.

Gamma-Funktion

Definition Gamma-Funktion

Die Gamma-Funktion ist definiert durch: Γ:(0,), Γ(x)=0tx1et dt

Gamma-Funktion in R

In R berechnet man Γ(x) für x(0,) durch gamma(x).

Werte der Gamma-Funktion auf den ganzen und halben Zahlen
  • Für alle n{0} gilt: Γ(n)=(n1)!
  • Für alle n gilt: Γ(n+12)=(2n)!n!4nπ
Beispiel zur Gamma-Funktion

Es gilt:
Γ(12)=πΓ(1)=1Γ(32)=12πΓ(2)=1Γ(52)=34πΓ(3)=2Γ(72)=158πΓ(4)=6

t-Verteilung

Definition t-Verteilung

Sei k gegeben.

Eine ZV X mit der W-Dichte f:[0,), f(t)=Γ(k+12)kπΓ(k2)(1+t2k)k+12
heißt t-verteilt mit k Freiheitsgraden (FG).

Verteilungsfunktion einer t-Verteilung

Die Verteilungsfunktion einer t-verteilten ZV mit k FG bezeichnen wir mit Tk: Tk(x)=xf(t) dt=Γ(k+12)kπΓ(k2)x(1+x2k)k+12 dt

Beispiel t-Verteilung

image

Beispiel t-Verteilung interaktiv

Interaktive Shiny-App zur t-Verteilung:
Download und Link

t-Verteilung und Normalverteilung

Für große k nähert sich die t-Verteilung einer Standardnormalverteilung an (also Tk(x)Φ(x) für große k).

t-Verteilung in R

Für eine t-verteilte ZV X mit k FG berechnet man in R:

  • die Funktionswerte der W-Dichte von X durch: f(t)=dt(t,k)
  • die Funktionswerte der VF von X durch: Tn(x)=pt(x,k)
  • die Wahrscheinlichkeit für X[u,v] durch: P(uXv)=pt(v,k)pt(u,k)
  • für q]0,1[ die Zahl x mit Tk(x)=q durch: x=qt(q,k)

Χ2-Verteilung

Definition Χ2-Verteilung

Sei k gegeben.

Eine ZV X mit der W-Dichte
f:[0,), f(t)={12k2Γ(k2)t(k21)et2,falls t>00,falls t0
heißt Χ2 -verteilt mit k Freiheitsgraden (FG).

Verteilungsfunktion Χ2-Verteilung

Die Verteilungsfunktion einer χ2-verteilten ZV mit k FG bezeichnen wir mit Sk:

  • für x0: Sk(x)=x0 dt=0

  • für x>0: Sk(x)=xf(t) dt=12k2Γ(k2)0xt(k21)et2 dt
Beispiel Χ2-Verteilung

image

Beispiel Χ2-Verteilung interaktiv

Interaktive Shiny-App zur Chi-Quadrat-Verteilung:
Download und Link

Χ2-Verteilung in R

Für eine χ2-verteilte ZV X mit k FG berechnet man in R:

  • die Funktionswerte der W-Dichte von X durch: f(t)=dchisq(t,k)
  • die Funktionswerte der VF von X durch: Tn(x)=pchisq(x,k)
  • die Wahrscheinlichkeit für X[u,v] durch: P(uXv)=pchisq(v,k)pchisq(u,k)
  • für q]0,1[ die Zahl x mit Tk(x)=q durch: x=qchisq(q,k)

Seiteninformation

Diese Lernresource können Sie als Wiki2Reveal-Foliensatz darstellen.

Wiki2Reveal

Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Kurs:Statistik für Anwender' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.