Reichel Mathematik 8, Schulbuch

242 Stochastik IV Festzuhalten bleibt, dass die Berechnung von Φ keinen Beweis für den vermuteten Zusammenhang liefert, und zwar prinzipiell nicht, nicht nur weil der Stichprobenumfang n = 10 doch sehr gering war. Stochastische Aussagen sind prinzipiell unsicher. Und sie sind es umso mehr, je weniger „scharfe“ Voraussetzungen man besitzt. Wüsste man – was mit unserer Erfahrung übereinstimmt und wieder mit gewissen Testverfahren geprüft werden könnte – dass die Körpergröße und das Körpergewicht normal- verteilte Merkmale sind, die absolutskaliert erhoben wurden, so hätte man mehr Information und könnte andere Methoden und Kennzahlen einsetzen: Definition Sind X und Y zwei absoøutskaøierte normaøver­ teiøte Merkmaøe, die in zwei aøternative Merkmaøs­ ausprägungen x 1 und x 2  = x 1 ’ sowie y 1 und y 2  = y 1 ’ eingeteiøt werden, so heißt die Zahø r tet ≈ cos ​  π ·​ 9 __ ad​ ______  ​ 9 __ bc​+ ​ 9 _ ad​ ​  (Bogenmaß!) tetrachorischer Koeffizient zur Vierfeødertafeø (der absoøuten Häufigkeiten). Bemerkungen: 1) r tet beschreibt den Zusammenhang zwischen den Merkmalen X und Y stets durch eine Zahl aus [‒1 ; 1] . Begründe ! 2) Ob man y 2 als y 1 ’ oder y 1 als y 2 ’ bezeichnet, ist egal. Nicht egal ist jedoch, ob die Merkmalsausprägung y 1 oberhalb oder unterhalb von y 2 steht. Begründe ! Beispiel A (Fortsetzung) Berechne a Φ , b r tet ! Interpretiere! Lösung: a Φ = ​  5·3 – 1·1 _______________   ​ 9 ______________ __ (1 + 5) (3 + 1) (1 + 3) (5 + 1)​ ​= ​  14 ___  ​ 9 __ 24 2 ​ ​= ​  7 __  12 ​≈ 0,58 b r tet = cos ​  π ·​ 9 ___ 1·1​ _______  ​ 9 __ 3·5​+ ​ 9 _ 1·1​ ​≈ 0,80 Der Zusammenhang ist (wie erwartet) „mitteøstark“ positiv, dh.: Große Menschen sind eher schwerer aøs køeine Menschen. Auf Fragestellungen wie in Beispiel A trifft man immer dann, wenn man nach Überdurchschnittlich oder Unterdurchschnittlich fragt. Keine Diskussion im Alltag und in der Politik zu Einkommen, Steuerleistung, Verkehrsaufkommen, Lärmbelästigung usw. kommt daran vorbei. Entscheidend für die Antwort ist, wie man die Trennlinien in der Vierfeldertafel definiert. In Bei- spiel A war die Fragestellung „schwammig“ und die beiden Merkmale daher nur nominalskaliert statt (wie nach An­ gabe fester Grenzen) ordinalskaliert oder (wie nach An­ gabe von Messwerten für jede Person) absolutskaliert; die Antworten mussten entsprechend „unpräzise“ sein. Präzise(r e) Antworten erfordern also einen genauere Ska- lierung, mit anderen Worten: statt Vierfeldertafeln Mehr- feldertafeln . Letztendlich tritt an die Stelle einer diskreten zweistelligen Häufigkeitsfunktion eine zweistellige ste­ tige Häufigkeitsdichtefunktion . Wie im eindimensionalen Fall könnte man mit Hilfe der Integralrechnung analoge Sätze zu den aus der 6. Klasse geläufigen Sätzen von der totalen Wahrscheinlichkeit, von BAYES usw. sowie zum Unabhängigkeitskriterium formulieren, was den Rahmen dieses Buches aber wohl sprengt. Tafel [7] Kontin- genztafel x 1 x 2 = x 1 ’ Zeilen- summen y 2 = y 1 ’ a b a + b y 1 c d c + d Spaltensummen a + c b + d Umfang n A  1011b A  1012 Fig. IV.4a Merkmal 2 rel. Häufigkeit Merkmal 1 Fig. IV.4b Merkmal 2 Dichte Merkmal 1 F  IV. 4a F  IV. 4b 160197-242 Nur zu Prüfzwecken – Eigentum des Verlags öbv

RkJQdWJsaXNoZXIy ODE3MDE=