Mathematik verstehen 8, Schulbuch

87 5.1 Streubereiche Schätzung einer relativen Häufigkeit in einer Stichprobe L Wir gehen von Beispiel 1 auf Seite 86 aus und fragen: Welche relative Häufigkeit h eines Merkmals erhält man schätzungsweise in einer Stichprobe vom Umfang n​ = 150​, wenn der relative Anteil des Merkmals in der zugehörigen Grundgesamtheit p​ = 0,5​beträgt? Das Ziehen einer Stichprobe ist ein Zufallsversuch. Die relative Häufigkeit h des Merkmals in einer Stichprobe ist daher eine Zufallsvariable. Man kann den vor dem Ziehen unbekannten Wert von h auf verschiedene Arten schätzen: • Man kann eine Punktschätzung durchführen und zB den relativen Anteil p des Merkmals in der Grundgesamtheit als Schätzwert für den Stichprobenwert h nehmen, also: h​ ≈ p = 0,5​. Diese Schätzung ist zwar „punktgenau“, dafür aber nicht sehr zuverlässig, weil der Stichprobenwert h von p zufällig stark abweichen kann. • Sinnvoller ist es, man führt eine Intervallschätzung durch, zB h​ * ​[ 49 %; 51 % ] ​oder ​h * ​[ 20 %; 80 % ] ​oder im Extremfall h​ * ​[ 0 %; 100 % ]​. Dabei ist klar: Je höher die Schätzgenauigkeit, desto geringer ist die Zuverlässigkeit der Schätzung. Um also eine bestimme Intervallschätzung von h zu erhalten, muss man zuerst eine gewünschte Sicherheit (= Zuverlässigkeit) ​γ ​für die Schätzung vorgeben und dann ein Intervall bestimmen, in dem h mit der Wahrscheinlichkeit ​γ ​liegt. Definition Sei p der relative Anteil eines Merkmals in einer Grundgesamtheit und sei h die unbekannte relative Häufigkeit h des Merkmals in einer Stichprobe vom Umfang n. Dann versteht man unter dem γ-Streubereich bzw. γ-Schätzbereich für h das symmetrisch um p liegende Intervall, welches h mit der Wahrscheinlichkeit γ enthält. BEMERKUNG M eist wählt man γ = 0,95 oder γ = 0,99. Falls γ = 0,95 ist, spricht man von einem 0,95-Streubereich bzw. 95 %-Streubereich. Analog spricht man für γ = 0,99 von einem 0,99 Streubereich bzw. 99 %-Streubereich. Wie kann man einen γ-Streubereich für h näherungsweise ermitteln? Sind ​γ​, p und n vorgegeben bzw. bekannt, dann ist die absolute Häufigkeit H des untersuchten Merkmals in der Stichprobe binomialverteilt mit den Parametern n und p. Diese Binomialverteilung kann näherungsweise durch eine Normalverteilung mit ​μ = n · p und σ = ​� _n · p · ​ (1 – p) ​ersetzt werden, falls die Faustregel erfüllt ist. Gegebenenfalls bestimmt man dann ein symmetrisches Intervall um μ, in dem H mit der Wahrscheinlichkeit γ liegt (vgl. Abschnitt 4.3). Dividiert man die Intervallgrenzen durch n, so erhält man den zugehörigen γ-Streubereich für h. Mithilfe des folgenden Satzes kann man γ-Streubereiche näherungsweise ermitteln: Satz Ist p der relative Anteil eines Merkmals in einer Grundgesamtheit, dann gilt für die relative Häufigkeit h des Merkmals in einer Stichprobe von großem Umfang n: γ-Streubereich für h​≈ ​[ p – z · ​� ______ ​ p · ​(1 – p)​ __ n ​;p+z·​� ______ ​ p · ​(1 – p)​ __ n ​]​ mit Φ ​(z) ​= ​ 1 + γ _ 2 ​ Nur zu Prüfzwecken – Eigentum des Verlags öbv

RkJQdWJsaXNoZXIy MTA2NTcyMQ==