Reichel Mathematik 8, Schulbuch
241 IV.2 Zweidimensionale Verteilungen IV Die Tafel [4] entsteht offenbar, indem man den Wert jedes Feldes in Tafel [3] durch die zugehörige Zeilensumme (in der Randspalt e) dividiert, also zB 1 __ 10 / 6 __ 10 = 1 _ 6 , was durch die Notation A ! B (bewusst) suggeriert wird. Analog entsteht Tafel [5], wenn man den Wert jedes Feldes in Tafel [3] durch die zugehörige Spalten- summe (in der Randzeil e) dividiert. Letztlich spiegeln diese Berechnungen nichts anderes wider als die (umgekehrte Anwendung der) Produktregel bzw. den Satz von BAYES, mit dessen Hilfe sich die Werte in Tafel [4] und [5] ineinander umrechen lassen. Erøäutere anhand von Buch 6. Kø. S. 188! 2. Abhängige und unabhängige Merkmale Die Vierfeldertafeln in Beispiel A legen nahe, dass Größe und Gewicht eines Menschen nicht voneinan- der unabhängig sind – was es dann mit den Mitteln der Statistik zu „beweisen“ gilt. Beispiel A (Fortsetzung) Beweise mit Hiøfe des Unabhängigkeitskriteriums (Buch 6. KL. S. 190), dass die Körpergröße und das Körpergewicht voneinander abhängen! Lösung: Sei X das Merkmaø „Körpergröße“ und Y das Merkmaø „Körpergewicht“. Dann sagt das Unab- hängigkeitskriterium, dass die beiden Merk- maøe genau dann stochastisch unabhängig sind, wenn die reøative Häufigkeit P (X ? Y) für aøøe Merkmaøsausprägungen gøeich dem Produkt von P (X) und P (Y) der reøativen Häufigkeiten ist. Da die P (X) in der Randzeiøe, die P (Y) in der Randspaøte erscheinen, gewinnt man die Werte P (X ? Y), indem man für jedes der vier Feøder das Produkt der Werte in der zugehörigen Randzeiøe und Randspaøte berechnet. Das Ergebnis weicht offensichtøich von denen in Tafeø [3] ab; die Merkmaøe sind stochastisch abhängig. 3. Messen der Stärke der Abhängigkeit zweier Merkmale Zu der Aussage, dass Körpergröße und Körpergewicht voneinander abhängig sind, wären wir auch gekommen, wenn die Werte in Tafel [3] und [6] sich nur ganz geringfügig unterschieden hätten. Der Test mit dem Unabhängigkeitskriterium ist eben ein Test auf ja oder nein . Häufig will man aber mehr – nämlich die Stärke des erkannten Zusammenhangs durch eine Zahl aus- drücken. Dafür gibt es je nach Art der Verteilung und Skalierung der Merkmale viele Maßzahlen. Zwei davon wollen wir hier ohne nähere Herleitung anführen. Definition Sind X und Y zwei nominaøskaøierte beøiebig ver- teiøte Merkmaøe mit je zwei aøternativen Merk- maøsausprägungen x 1 und x 2 = x 1 ’ sowie y 1 und y 2 = y 1 ’, so heißt die Zahø Φ = bc – ad ________________ 9 _________ __ __ (a + b) (c + d) (a + c) (b + d) Kontingenzkoeffizient zur Vierfeødertafeø (der absoøuten Häufigkeiten). Bemerkungen: 1) Φ beschreibt den Zusammenhang zwischen den Merkmalen X und Y stets durch eine Zahl aus [‒1 ; 1] . Begründe ! 2) Ob man y 2 als y 1 ’ oder y 1 als y 2 ’ bezeichnet, ist egal. Nicht egal ist jedoch, ob die Merkmalsausprä- gung y 1 oberhalb oder unterhalb von y 2 steht. Begründe ! Tafel [6] Unab- hängigkeitstest eher klein eher groß Zeilen- summen eher schwer 24/100 36/100 6/10 eher leicht 16/100 24/100 4/10 Spaltensummen 4/10 6/10 10/10 = 1 Tafel [7] Kon tingenztafel x 1 x 2 = x 1 ’ Zeilen- summen y 2 = y 1 ’ a b a + b y 1 c d c + d Spaltensummen a + c b + d Umfang n A 1011a A 1012 160197-241 Nur zu Prüfzwecken – Eigentum des Verlags öbv
Made with FlippingBook
RkJQdWJsaXNoZXIy ODE3MDE=