Suche
Suche Menü

Grundlagen der Statistik: Wie unterscheidet man zwischen Nominal-, Ordinal- und Kardinalskala?

Schulnoten

Nehmen wir einmal an, uns lägen von einer Untersuchung der Wassertiefe an einem Deich genau zwei Merkmalswerte vor: Die Wassertiefe (1,85 m) sowie die Haarfarbe der Person, welche die Messung vorgenommen hat (blond). Intuitiv wird uns klar sein, dass sich mit dem Wert für die Wassertiefe deutlich mehr anfangen lässt, als mit der Angabe der Haarfarbe. So könnte man den Wert etwa mit dem einer vorherigen Messung vergleichen und berechnen, um wie viel Prozent der Wasserstand gefallen oder gestiegen ist. Kalkulieren könnte man auch die Differenz zur Höhe des Deichs und damit die Höhe, um die das Wasser noch steigen könnte, bevor eine kritische Marke erreicht wird. Im Hinblick auf die Haarfarbe könnten wir dagegen lediglich einen Vergleich mit den Aufzeichnungen früherer Messungen anstellen und ermitteln, ob die Prüfer stets blond waren, oder ob auch andere Haarfarben vertreten sind.

Der Informationsgehalt des Merkmals „Wassertiefe in m“ ist offenbar deutlich größer als der Informationsgehalt des Merkmals „Haarfarbe“. Diese zentrale Eigenschaft von Merkmalen bzw. Variablen wird in der Statistik als deren Skalenniveau bezeichnet. Da die Durchführbarkeit einer Vielzahl von Analysen direkt oder indirekt davon abhängig ist, dass die vorhandenen Daten ein bestimmtes Skalenniveau erreichen, ist dessen fehlerfreie Bestimmung eine unerlässliche Voraussetzung für die Anwendung dieser Verfahren. Für die Zwecke unserer Statistik-Blogserie hier im „Wissenschafts-Thurm“ wird eine Unterscheidung in die nachfolgend dargestellten drei Skalenniveaus ausreichend sein.

Nominalskalenniveau

Bei nominalskalierten Daten handelt es sich um Daten, die in keinerlei natürliche Reihenfolge gebracht werden können – beispielsweise um das Geschlecht, die Haarfarbe oder die Telefonnummer. Feststellbar ist hier lediglich, ob zwei statistische Einheiten im Hinblick auf ein nominalskaliertes Merkmal die gleichen Ausprägungen aufweisen – d.h. ob etwa beide befragten Personen blond sind oder ob sie über unterschiedliche Haarfarben verfügen. Da es sich beim Nominalskalennivau um dasjenige Skalenniveau mit dem geringsten Informationsgehalt handelt, lassen sich mit nominalskalierten Daten nur wenige Berechnungen anstellen – so kommt etwa als Lagemaß nur der Modus in Frage, während sich Streuung, Schiefe oder Wölbung einer nominalskalierten Verteilung gar nicht bestimmen lassen.

Beispiele: Geschlecht, Kontonummer, Haarfarbe, Telefonnummer, Geschmacksrichtung…

Ordinalskalenniveau

Im Gegensatz zu nominalskalierten Daten können ordinalskalierte Daten zwar in eine natürliche Reihenfolge gebracht werden – da allerdings die Abstände zwischen den einzelnen Werten nicht quantifizierbar sind, kann mit ihnen nicht „normal gerechnet“ werden, obwohl es sich auf den ersten Blick um „normale Zahlen“ handelt. Das klassische Beispiel hierfür sind Schulnoten. Schulnoten weisen sowohl eine natürliche Reihenfolge (eine 1 ist besser als eine 2, eine 2 ist besser als eine 3 usw.) als auch unterschiedliche Abstände zwischen den einzelnen Werten auf (der Notenbereich der 1 umfasst den Bereich von 92% bis 100% der maximal erreichbaren Punkte, der Notenbereich der 5 dagegen den Bereich von 0% bis 49%). Aus diesem Grund sind Rechenoperationen wie etwa das Addieren oder das Subtrahieren von Noten nicht sinnvoll: Zwei „2er“ ergeben keinen „4er“ – und wenn man von einem „2er“ einen „1er“ abzieht, erhält man auch keinen „3er“. Wenn man aber Schulnoten nicht addieren (oder dividieren) kann, folgt daraus auch, dass man beispielsweise kein arithmetisches Mittel aus ihnen bilden darf – auch wenn das leider an sehr vielen Schulen konsequent falsch praktiziert wird (und damit Generationen von Schülerinnen und Schülern für die Statistik verdorben werden).

Beispiele: Schulnoten, Präferenzrangfolgen, Zufriedenheit (z.B. auf einer Skala von 1 bis 5), militärische Dienstränge…

Metrisches Skalenniveau

Metrisch skalierte Daten verfügen über eine natürliche Reihenfolge sowie auch über quantifizierbare Abstände – mit ihnen kann also ganz „normal“ gerechnet werden. In vielen Lehrbüchern wird innerhalb der metrischen Skala – die häufig auch als Kardinalskala bezeichnet wird – zusätzlich noch in die Intervallskala (ohne natürlichen Nullpunkt – z.B. Temperatur in Celsius) und in die Verhältnisskala (mit natürlichem Nullpunkt – z.B. Temperatur in Kelvin) unterschieden. Für die Zwecke unserer kleinen Blogserie wird diese Unterscheidung allerdings nicht von Bedeutung sein – hier reicht es vollkommen aus, metrisch skalierte Daten als solche korrekt erkennen zu können.

Beispiele: Zeitdauer in sek, Wassertiefe in cm, Preis in Euro und Cent, Streckenlänge in mm…

Skalenniveaus

(Die Unterschiede zwischen diskreten und stetigen Daten sowie zwischen häufbaren und nicht häufbaren Merkmalen, werden wir dann übrigens in den nächsten Artikeln dieser Blogserie betrachten.)

Auf- und Abwärtskompatibilität

Für die im Rahmen unserer Blogserie betrachteten statistischen Verfahren gilt, dass sie im Hinblick auf das Skalenniveau – um an dieser Stelle einmal einen Begriff aus der Informatik zu bemühen – abwärtskompatibel, nicht aber aufwärtskompatibel sind. Dies bedeutet: Verfahren, die ein niedrigeres Skalenniveau voraussetzen, können stets auch auf Daten eines höheren Skalenniveaus angewandt werden – Verfahren, die ein höheres Skalenniveau voraussetzen, dürfen dagegen nie auf Daten eines niedrigeren Skalenniveaus angewandt werden. Da beispielsweise die Bestimmung des Modus lediglich voraussetzt, dass mindestens nominalskalierte Daten vorliegen, kann der Modus (wenn die übrigen Voraussetzungen erfüllt sind) auch für ordinalskalierte und metrische Daten bestimmt werden. Auf der anderen Seite kann etwa der Median, dessen Berechnung mindestens ordinalskalierte Daten voraussetzt, nicht für nominalskalierte Daten berechnet werden – die Berechnung für metrische Daten wäre dagegen problemlos möglich.

Der „Cheat Sheet“: Übersicht der Mindestskalenniveaus

An dieser Stelle greifen wir den in den nächsten Wochen noch folgenden Blogposts in einer kurzen Übersicht schon einmal ein wenig vor: Welches Skalenniveau muss mindestens erreicht werden, um eine Grafik erstellen oder eine Berechnung durchführen zu können?

1) Lagemaße / Maße der zentralen Tendenz

Modus: Nominalskala
Median: Ordinalskala
Quartile: Ordinalskala
Quantile: Ordinalskala
Perzentile: Ordinalskala
Arithmetisches Mittel: Kardinalskala
Geometrisches Mittel: Kardinalskala
Harmonisches Mittel: Kardinalskala

2) Streuungsmaße / Dispersionsparameter

Fünf-Werte-Zusammenfassung: Ordinalskala
Interquartilsabstand: Ordinalskala
Spannweite: Kardinalskala
Varianz: Kardinalskala
Standardabweichung: Kardinalskala
Variationskoeffizient: Kardinalskala

3) Verteilungsmaße / Schiefe und Wölbung

Quartilskoeffizient der Schiefe: Ordinalskala
Momentenkoeffizient der Schiefe: Kardinalskala
Kurtosis / Exzeß: Kardinalskala

4) Grafische Darstellungsformen

Venn-Diagramm: Nominalskala
Stamm-Blatt-Diagramm: Ordinalskala
(erweiterter) Box-Whisker-Plot: Ordinalskala

5) Zusammenhangsmaße

Chi²-Test auf stochastische Unabhängigkeit: Nominalskala
Rangkorrelationskoeffizient nach Spearman: Ordinalskala
Konkordanzkoeffizient nach Kendall: Ordinalskala
Bravais-Pearson-Korrelationskoeffizient: Kardinalskala


Die hier vorgestellten Inhalte und Aufgaben sind Teil der Vorlesung „Grundlagen der Statistik“ im berufsbegleitenden Bachelor-Studiengang Betriebswirtschaftslehre an der Hochschule Harz.

Autor:

Christian Reinboth

Christian Reinboth ist Wirtschaftsinformatiker und einer der Mit-Gründer der HarzOptics GmbH, einem An-Institut der Hochschule Harz. Die Entwicklung und Planung umweltfreundlicher Beleuchtung sowie die statistische Datenanalyse sind wesentliche Schwerpunkte seiner Forschungs- und Lehrtätigkeit.

4 Kommentare Schreibe einen Kommentar

  1. Sehr interessant und anschaulich beschrieben, Christian. Allerdings verstehe ich noch nicht, warum ich von Schulnoten kein arithmetisches Mittel bilden darf. Nur weil ich diese nicht addieren oder subtrahieren kann? Für mich hat dieser Wert eine Aussagekraft. Er gibt an, welche Note im Durchschnitt über alle erreichten Noten erzielt wurde. Damit kann ich dann ermitteln, welche Note (Schüler, Student) besser oder schlechter als der Durchschnitt ist. Es werden doch sogar Verteilungsfunktionen ermittelt, um z.B. zu schauen, in wieweit die Notenverteilung mit der Normalverteilung übereinstimmt.

    Antworten

    • Christian Reinboth

      Das ist in der Tat genau der springende Punkt: Weil man ordinalskalierte Daten nicht addieren und auch nicht dividieren kann, kann man aus ihnen wirklich auch kein arithmetisches Mittel bilden, da dieses ja genau diese beiden Rechenschritte (erst alle Werte addieren, dann die Summe durch die Anzahl der Werte dividieren) voraussetzt. Dass der so berechnete Wert irgendwie richtig zu sein scheint bzw. sich „richtig anfühlt“, dürfte hauptsächlich daran liegen, dass sich aufgrund der Begrenztheit der Notenskala (nur Werte von 1 bis 5 bzw. von 1 bis 6) meist Werte ergeben, die (etwa im Gegensatz zum arithmetischen Mittel aus Telefonnummern) einen Sinn zu ergeben scheinen und die zudem nahe am rechnerisch tatsächlich möglichen Mittelwert – dem Median – liegen. Es bleibt aber trotzdem falsch – auch wenn es in der Praxis natürlich vielfach so gehandhabt wird (war in meiner Schule damals nicht anders).

      Ein weiteres, ganz grundsätzliches Problem bei Schulnoten ist die Subjektivität der Notenvergabe. Dass es bei 80% der erreichbaren Punkte eine 2,0 gibt, sieht nur auf den ersten Blick nach einem objektiven Bewertungskriterium aus – denn wofür gibt es beispielsweise bei der Interpretation eines Gedichts (klar – bei Mathe geht das besser) am Ende Punkte oder Punktabzüge? Das kann bekanntlich nicht nur von Lehrer zu Lehrer, sondern durchaus auch von Schüler zu Schüler erheblich variieren. Die Behandlung von Schulnoten als kardinalskalierte Daten – gleichwertig mit beispielsweise einer gemessenen Wassertiefe in cm – unterstellt deshalb auch eine Objektivität und Vergleichbarkeit, die in der Praxis einfach nicht gegeben ist. Erwin Ebermann von der Uni Wien hat dazu in seinem Skript einiges geschrieben:

      https://www.univie.ac.at/ksa/elearning/cp/quantitative/quantitative-52.html

      Antworten

      • Ich möchte anmerken, dass „gleichwertig mit beispielsweise einer gemessenen Wassertiefe in cm “ hier nicht trifft, da dies auf einer Ratio-Skala abgebildet werden kann (aufgrund des absoluten Nullpunktes). Einen solchen absoluten Nullpunkt gibt es bei Noten auf gar keinen Fall, weshalb diese allerhöchstens als intervalskaliert angesehen werden könnten (wie etwa die Temperatur in °C). „20°C ist doppelt so warm wie 10°C“ ist unsinnig, „20 cm unter der Wasseroberfläche ist doppelt so tief wie 10cm“ dagegen nicht.
        Davon abgesehen sehe ich Schulnoten aber, wie Christian, als Ordinalskaliert an.

        Antworten

        • Christian Reinboth

          Völlig richtig – ein intervallskaliertes Beispiel wie Temperatur in °C wäre hier in der Tat besser geeignet gewesen. Auch an diesem Beispiel lassen sich die beiden wesentlichen Unterschiede zu Schulnoten ja aber gut darstellen:

          1) Die Differenzen zwischen den einzelnen Messpunkten der Skala sind identisch, d.h. auch wenn „20 °C ist doppelt so warm wie 10 °C“ eher weniger sinnvoll ist, so gilt doch, dass z.B ein Anstieg um 1 °C immer mit dem gleichen Sprung in der Skala verbunden ist, egal ob ich bei 5 °C oder bei 100 °C beginne – während der Sprung von einer 5,0 auf eine 4,0 im Hinblick auf direkt (Punkte) sowie indirekt (Leistung/Verständnis) gemessene Merkmale ein ganz anderer sein kann, als der von einer 2,0 auf eine 1,0.

          2) Zehn Physiker*innen messen mit dem gleichen Thermometer im gleichen Raum zu gleichen Zeit zehn Mal die gleiche (oder zumindest fast gleiche) Temperatur. Zehn Lehrer*innen können das gleiche Essay zur Gretchenfrage in „Faust“ zehn Mal völlig unterschiedlich bewerten – von der Problematik des Leistungsvergleiches bei unterschiedlichen Anforderungen (z.B. verschiedenen Fächern) noch ganz abgesehen…

          Antworten

Schreibe einen Kommentar

Pflichtfelder sind mit * markiert.