87 5.1 Streubereiche Schätzung einer relativen Häufigkeit in einer Stichprobe L Wir gehen von Beispiel 1 auf Seite 86 aus und fragen: Welche relative Häufigkeit h eines Merkmals erhält man schätzungsweise in einer Stichprobe vom Umfang n = 150, wenn der relative Anteil des Merkmals in der zugehörigen Grundgesamtheit p = 0,5beträgt? Das Ziehen einer Stichprobe ist ein Zufallsversuch. Die relative Häufigkeit h des Merkmals in einer Stichprobe ist daher eine Zufallsvariable. Man kann den vor dem Ziehen unbekannten Wert von h auf verschiedene Arten schätzen: • Man kann eine Punktschätzung durchführen und zB den relativen Anteil p des Merkmals in der Grundgesamtheit als Schätzwert für den Stichprobenwert h nehmen, also: h ≈ p = 0,5. Diese Schätzung ist zwar „punktgenau“, dafür aber nicht sehr zuverlässig, weil der Stichprobenwert h von p zufällig stark abweichen kann. • Sinnvoller ist es, man führt eine Intervallschätzung durch, zB h * [ 49 %; 51 % ] oder h * [ 20 %; 80 % ] oder im Extremfall h * [ 0 %; 100 % ]. Dabei ist klar: Je höher die Schätzgenauigkeit, desto geringer ist die Zuverlässigkeit der Schätzung. Um also eine bestimme Intervallschätzung von h zu erhalten, muss man zuerst eine gewünschte Sicherheit (= Zuverlässigkeit) γ für die Schätzung vorgeben und dann ein Intervall bestimmen, in dem h mit der Wahrscheinlichkeit γ liegt. Definition Sei p der relative Anteil eines Merkmals in einer Grundgesamtheit und sei h die unbekannte relative Häufigkeit h des Merkmals in einer Stichprobe vom Umfang n. Dann versteht man unter dem γ-Streubereich bzw. γ-Schätzbereich für h das symmetrisch um p liegende Intervall, welches h mit der Wahrscheinlichkeit γ enthält. BEMERKUNG M eist wählt man γ = 0,95 oder γ = 0,99. Falls γ = 0,95 ist, spricht man von einem 0,95-Streubereich bzw. 95 %-Streubereich. Analog spricht man für γ = 0,99 von einem 0,99 Streubereich bzw. 99 %-Streubereich. Wie kann man einen γ-Streubereich für h näherungsweise ermitteln? Sind γ, p und n vorgegeben bzw. bekannt, dann ist die absolute Häufigkeit H des untersuchten Merkmals in der Stichprobe binomialverteilt mit den Parametern n und p. Diese Binomialverteilung kann näherungsweise durch eine Normalverteilung mit μ = n · p und σ = � _n · p · (1 – p) ersetzt werden, falls die Faustregel erfüllt ist. Gegebenenfalls bestimmt man dann ein symmetrisches Intervall um μ, in dem H mit der Wahrscheinlichkeit γ liegt (vgl. Abschnitt 4.3). Dividiert man die Intervallgrenzen durch n, so erhält man den zugehörigen γ-Streubereich für h. Mithilfe des folgenden Satzes kann man γ-Streubereiche näherungsweise ermitteln: Satz Ist p der relative Anteil eines Merkmals in einer Grundgesamtheit, dann gilt für die relative Häufigkeit h des Merkmals in einer Stichprobe von großem Umfang n: γ-Streubereich für h≈ [ p – z · � ______ p · (1 – p) __ n ;p+z·� ______ p · (1 – p) __ n ] mit Φ (z) = 1 + γ _ 2 Nur zu Prüfzwecken – Eigentum des Verlags öbv
RkJQdWJsaXNoZXIy MTA2NTcyMQ==