Diese Website verwendet Cookies, damit wir dir die bestmögliche Benutzererfahrung bieten können. Cookie-Informationen werden in deinem Browser gespeichert und führen Funktionen aus, wie das Wiedererkennen von dir, wenn du auf unsere Website zurückkehrst, und hilft unserem Team zu verstehen, welche Abschnitte der Website für dich am interessantesten und nützlichsten sind.
Chi-Quadrat Streuungstest
- 31. Mai 2017
- Posted by: Mika
Dieser Artikel erklärt den Chi-Quadrat Streuungstest. Viele der bisher erläuterten Methoden befassen sich mit dem Vergleich von Mittelwerten oder Häufigkeiten. Bei Fragestellungen, welche die Streuung von Daten in den Vordergrund stellen, ist es jedoch wesentlich aussagekräftiger Varianzen zu testen. Je größer die Streuung eines Wertes ist, desto weniger Sinn macht es Analysen hinsichtlich Mittelwerten durchzuführen und parametrische Verfahren anzuwenden.
Eine Methode mit der Du überprüfen kannst, ob Varianzen einer Stichprobe und einer Grundgesamtheit homogen sind oder nicht, ist der Streuungstest. Dabei wird die von dir gemessene Varianz statistisch mit der Varianz einer zugrundliegenden Gesamtheit verglichen. Es wird dann analysiert, inwiefern die beiden Varianzen übereinstimmen.
Verteilung der Prüfgröße
Die Mathematik hinter dem Verfahren beruht auf der -Verteilung. Du testest hiermit ungerichtet, d. h. statistisch betrachtet kannst Du lediglich eine Unterschiedshypothese aufstellen. Wie viel größer die Varianz in Deiner Stichprobe im Vergleich zur Grundgesamtheit eventuell ist, kannst Du nur anhand der Zahlenwerte beurteilen.
Viele parametrische Verfahren verlangen homogene Varianzen, damit Du sie überhaupt durchführen und valide interpretieren kannst. Je nach experimentellem Design sieht die genaue Umsetzung dieser Annahme auf die Daten ein bisschen unterschiedlich aus.
Bei Korrelationsstudien soll die Varianz der einen Variable bspw. über alle Stufen der anderen Variable hinweg konstant sein. Hier solltest Du allerdings aufpassen, da Du für den Vergleich von zwei (unabhängigen) Stichproben einen F-Test berechnen musst. Den Streuungstest anzuwenden macht hingegen nur dann Sinn, wenn Du eine Stichprobe testen möchtest (welche Du mit einer Grundgesamtheit vergleichen willst). Solltest du den Streuungstest für Deine Analysen nutzen wollen, ist es wichtig, dass die Voraussetzung der Normalverteilung erfüllt ist. Denn dieser Test ist sehr sensibel gegenüber Verletzungen dieser Annahme.
Beispiel für eine Fragestellung
Im Zuge Deiner Fragestellung könnte Dich bspw. die Qualität von Kaffee interessieren. Stell Dir vor, Du führst eine Studie bezüglich der Qualität einer bestimmten Kaffeesorte durch. Anhand Deines Datensatzes kannst Du die Varianz der Kaffeequalität berechnen. Nun möchtest Du mit Hilfe des -Streuungstests herausfinden, ob die von Dir gemessene Varianz sich von dem Varianzwert unterscheidet, der in den Güterichtlinien festgelegt wurde.
Angenommen Deine Stichprobengröße umfasst 10 Proben, deren Qualität jeweils auf einer Skala von 15 beurteilt wurde (wobei 5 für hervorragende Qualität steht). Dein Datensatz könnte folgendermaßen aussehen:
Probe | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
---|---|---|---|---|---|---|---|---|---|---|
Qualität | 5 | 4 | 5 | 5 | 4 | 5 | 3 | 5 | 5 | 4 |
Damit ergibt sich eine Stichprobenvarianz . Nehmen wir an, das Unternehmen, das diese Kaffeesorte vertreibt, hat selbst eine große Untersuchung bezüglich Qualität durchgeführt, bevor der Kaffee in den Handel kam. Das Ergebnis des Unternehmens wurde in den Güterichtlinien verankert und besagt, dass die Qualität dieser Kaffeemarke eine Varianz aufweist (= Populationsvarianz). Diese Werte kannst Du nun in folgende Formel einsetzen:
und
Um zu überprüfen, ob sich die Stichprobenvarianz signifikant von der Varianz der Grundgesamtheit unterscheidet, musst Du den -Wert mit einem tabellarischen Wert vergleichen. Wenn der von Dir berechnete -Wert höher ist, als der Wert aus der Tabelle, ist der Unterschied signifikant. Tabellen für den Vergleich findest Du auch online, wenn Du bspw. nach „Tabelle der -Verteilung“ suchst. Für df = 9 und beträgt der tabellarische Wert 16.92 und ist somit größer als der von uns berechnete Wert 10. Die Varianz in unserer Stichprobe unterscheidet sich also nicht signifikant von der Varianz der Grundgesamtheit (-Streuungstest: ) und wir können das Ergebnis des Unternehmens bestätigen.