Mathematik verstehen 8, Schulbuch

89 5.2 Konfidenzintervalle 5.2 Konfidenzintervalle Schätzung eines relativen Anteils in einer Grundgesamtheit L Wir gehen von Beispiel 2 auf Seite 86 aus: Die relative Häufigkeit eines Merkmals in einer Stichprobe vom Umfang n = 200 beträgt h = 0,6. Welcher relative Anteil p des Merkmals ergibt sich daraus schätzungsweise in der Grundgesamtheit? Den unbekannten Wert von p kann man auf zwei Arten schätzen: Man kann zB die relative Häufigkeit h des Merkmals in der Stichprobe als Punktschätzung für p nehmen, also: p ≈ h = 0,6, was zwar genau, aber nicht sehr zuverlässig ist. Besser ist es, für den unbekannten relativen Anteil p eine Intervallschätzung anzugeben. Die Grundidee für die Konstruktion einer solchen Intervallschätzung ist dabei folgende: Für den unbekannten Wert von p gibt es „gute“ und „weniger gute“ Schätzwerte. Ein Schätzwert p gilt dann als „gut“, wenn er mit dem beobachteten Stichprobenwert h „verträglich“ ist, dh. wenn (bei gegebener Sicherheit γ) der zu p gehörige γ-Streubereich für die relative Häufigkeit des Merkmals den beobachteten Stichprobenwert h enthält. In Beispiel 2 ist etwa bei Vorgabe von γ = 0,95 der Schätzwert p = 0,7 mit dem Stichprobenwert h = 0,6 nicht verträglich. Warum? Angenommen es gilt tatsächlich p = 0,7. Dann ist [0,63; 0,77] der zu p gehörige 95 %-Streubereich für die relative Häufigkeit des Merkmals in der Stichprobe. Der beobachtete Stichprobenwert h = 0,6 liegt nicht in diesem Streubereich, dh. es ist ein sehr seltenes Stichprobenergebnis eingetreten (Wahrscheinlichkeit < 0,05). In der Statistik argumentiert man jetzt so: Statt anzunehmen, dass p = 0,7 zutrifft und ein „extremes“ Stichprobenergebnis eingetreten ist, nimmt man eher an, dass p = 0,7 mit h = 0,6 nicht verträglich ist, also p = 0,7 kein „guter“ Schätzwert ist. Nebenstehend sind einige „verträgliche“ Schätzwerte von p als schwarze Punkte samt ihren zugehörigen γ-Streubereichen dargestellt, die alle h überdecken. Man erkennt: Alle Schätzwerte p, deren γ-Streubereiche h überdecken, bilden das Intervall [p​ ​1;​ ​p ​2​]. Dieses Intervall erhält einen eigenen Namen: Definition Sei p der unbekannte relative Anteil eines Merkmals in einer Grundgesamtheit und sei h die relative Häufigkeit h des Merkmals in einer Stichprobe vom Umfang n. Dann versteht man unter dem γ-Konfidenzintervall bzw. γ-Vertrauensintervall für p die Menge aller Schätzwerte für p, deren zugehörige γ-Streubereiche den beobachteten Stichprobenwert h überdecken. BEMERKUNG γ bezeichnet man auch als Sicherheit oder Konfidenzniveau. Meist wählt man γ = 0,95 oder γ = 0,99. Falls γ = 0,95 ist, spricht man von einem 0,95-Konfidenzintervall bzw. 95 %-Konfidenzintervall. Analog spricht man für γ = 0,99 von einem 0,99-Konfidenzintervall bzw. 99 %-Konfidenzintervall. Wie kann man ein γ-Konfidenzintervall für p interpretieren? Was weiß man, wenn man aufgrund einer Stichprobe ein 95 %-Konfidenzintervall für einen unbekannten relativen Anteil p in einer Grundgesamtheit ermittelt hat? Naheliegend, aber falsch, wäre die Interpretation, dass der unbekannte Wert von p mit 95 %-iger Wahrscheinlichkeit im ermittelten Konfidenzintervall liegt. Dabei würde nämlich die unbekannte, aber feste Zahl p fälscherweise als Zufallsvariable aufgefasst werden. 0 p1 p2 h 1 Konfidenzintervall Nur zu Prüfzwecken – Eigentum des Verlags öbv

RkJQdWJsaXNoZXIy MTA2NTcyMQ==