Suche
Suche Menü

Grundlagen der Statistik: Der Chi-Quadrat-Unabhängigkeitstest

Stichprobe

Entscheiden sich junge Frauen häufiger als junge Männer für oder gegen bestimmte Studienfächer – wie ließe sich eine solche Frage mit Hilfe von Werkzeugen aus dem großen Methodenkoffer der Statistik beantworten? In dieser Ausgabe unseres Grundlagenkurses in Statistik und Stochastik hier im Wissenschafts-Thurm, lernen wir heute den sogenannten Chi-Quadrat-Unabhängigkeitstest kennen.

Beim Chi-Quadrat-Unabhängigkeitstest bzw. Chi-Quadrat-Test auf stochastische Unabhängigkeit (nachfolgend nur noch als Chi-Quadrat-Test bezeichnet), werden zwei nominal skalierte Merkmale (wie etwa das Geschlecht und die Entscheidung für oder gegen ein Studienfach) auf ihre sogenannte stochastische Unabhängigkeit geprüft. Hierzu werden die real beobachteten Häufigkeiten mit den zu erwartenden Häufigkeiten bei völliger Unabhängigkeit der Merkmale verglichen. Diese lassen sich berechnen, indem man die Randsummen in der Kontingenztabelle jeweils paarweise miteinander multipliziert und durch die Anzahl der Gesamtwerte dividiert.

Dazu ein Beispiel. Wir befragen 100 (fiktive) Personen nach ihrem Schulabschluss sowie nach dem Schulabschluss ihrer Eltern, um festzustellen, ob sich ein Zusammenhang finden lässt:

Beispiel Chi-Quadrat-Test

Zur Berechnung der zu erwartenden Werte bei stochastischer Unabhängigkeit werden zunächst die Randsummen (Zeilen- und Spaltensummen) gebildet:

Beispiel Chi-Quadrat-Test

Indem man nun die Randsummen multipliziert und durch die Gesamtsumme dividiert, erhält man den bei Unabhängigkeit zu erwartenden Wert, d.h. 55 * 54 / 100 = 29,7 anstelle von 43. Es ergeben sich die nachfolgend tabellierten zu erwartenden absoluten Häufigkeiten bei völliger stochastischer Unabhängigkeit der Variablen:

Beispiel Chi-Quadrat-Test

So würden sich also die 100 Befragten – erwartbar – auf die Kategorien verteilen, gäbe es überhaupt keinen Zusammenhang zwischen dem eigenen Schulabschluss und dem Schulabschluss der Eltern. Dass die tatsächlichen Werte von diesen Werten stark abweichen, ist bereits ein Indikator dafür, dass es durchaus einen Zusammenhang geben könnte. Mit Hilfe des Chi-Quadrat-Tests wollen wir nun herausfinden, ob dies auch tatsächlich der Fall ist. Dazu werden die Differenzen zwischen erwartetem und tatsächlichem Wert quadriert (um zu verhindern, dass negative und positive Abweichungen sich gegenseitig neutralisieren) und durch die zu erwartenden Werte dividiert. Die Summe der Ergebnisse ergibt dann den entscheidenden Chi-Quadrat-Wert.

(43 – 29,7)² / 29,7 = 5,955
(11 – 24,3)² / 24,3 = 7,279
(12 – 25,3)² / 25,3 = 6,991
(34 – 20,7)² / 20,7 = 8,545

Es ergibt sich eine Summe und damit ein Chi-Quadrat-Wert von 28,77. Dieser ist nun einem Vergleichswert aus der tabellierten Chi-Quadrat-Verteilung gegenüberzustellen, wobei in diesem Fall ein Fehlerniveau von 5% (d.h. 1 – a = 0,950) bei einem Freiheitsgrad gewählt wurde.

Im Beispiel landet man bei dieser Vorgehensweise bei einem Vergleichswert von 3,814, der im Rahmen des Testverfahrens auch als „kritischer Wert“ bezeichnet wird. Wird dieser durch den errechneten Wert überschritten, gilt die Nullhypothese des Tests, nach der die beiden Variablen „eigener Schulabschluss“ und „Schulabschluss der Eltern“ als voneinander völlig unabhängig einzustufen sind, als abgelehnt. Da dies hier der Fall ist, lautet der Schluss, dass – statistisch betrachtet – ein signifikanter Zusammenhang zwischen den Variablen besteht.

Beispielrechnung

30 FH-Erstsemester mit unterschiedlichem schulischen Background legen zu Beginn ihres Studiums einen Einstufungstest ab. Nachfolgend soll überprüft werden, ob zwischen dem Schulabschluss der Probanden und ihrem Testergebnis ein Zusammenhang besteht.

Beispiel Chi-Quadrat-Test

Schritt 1: Berechnung der Randsummen:

Beispiel Chi-Quadrat-Test

Schritt 2: Berechnung der zu erwartenden Verteilung bei völliger Unabhängigkeit:

Beispiel Chi-Quadrat-Test

Schritt 3: Summierung der quadrierten Differenzen geteilt durch die zu erwartenden Werte:

(7-7,6)²/7,6 = 0,0474
(6-5,7)²/5,7 = 0,0158
(6-5,7)²/5,7 = 0,0158
(5-4,4)²/4,4 = 0,0818
(3-3,3)²/3,3 = 0,0273
(3-3,3)²/3,3 = 0,0273

Es ergibt sich ein Chi-Quadrat-Wert von 0,2157, welcher den kritischen Wert von (hier erneut) 3,814 nicht überschreitet. Die Nullhypothese, nach der die beiden Variablen als unabhängig voneinander einzustufen sind, kann somit nicht verworfen werden, d.h. ein Zusammenhang ist nicht wahrscheinlich.

Übungsaufgabe

40 am Markt befindliche Statistik-Programme wurden auf die Frage hin geprüft, ob sie die nötige Funktionalität für den Einsatz in einer Statistik-Grundlagenvorlesung bieten. Festgehalten wurde auch, ob Programme kostenfrei verfügbar sind oder ob sie kostenpflichtig erworben werden müssen.

Beispiel Chi-Quadrat-Test

Sind die Merkmale „Anforderungserfüllung“ und „Kosten“ stochastisch unabhängig voneinander? Führen Sie einen Chi-Quadrat-Test bei einem Fehlerniveau von 5% durch.

Zur Anzeige der Lösungen bitte hier klicken.


Die hier vorgestellten Inhalte und Aufgaben sind Teil der Vorlesung „Grundlagen der Statistik“ im berufsbegleitenden Bachelor-Studiengang Betriebswirtschaftslehre an der Hochschule Harz.

Autor:

Christian Reinboth

Christian Reinboth ist Wirtschaftsinformatiker und einer der Mit-Gründer der HarzOptics GmbH, einem An-Institut der Hochschule Harz. Die Entwicklung und Planung umweltfreundlicher Beleuchtung sowie die statistische Datenanalyse sind wesentliche Schwerpunkte seiner Forschungs- und Lehrtätigkeit.

Schreibe einen Kommentar

Pflichtfelder sind mit * markiert.