Die statistischen Lagemaße werden auch als Mittelwerte oder Maße der zentralen Tendenz bezeichnet. Sie geben Auskunft über das Zentrum einer Verteilung und sind insbesondere dann gefragt, wenn es gilt, eine Verteilung mit nur einem Parameter zusammenzufassen – wie etwa die Einkommensverteilung mit der Angabe des Durchschnittseinkommens. (Warum nur ein Parameter für die Darstellung einer Verteilung in der Regel eben nicht ausreicht, wird in einem der nächsten Blogposts zum Thema Streuungsmaße erläutert.) Im Rahmen der meisten Vorlesungen werden insbesondere drei Lagemaße – das arithmetische Mittel (der „Durchschnittswert“ der Verteilung), der Median (der Wert genau in der Mitte der geordneten Verteilung) und der Modus (der in der Verteilung am häufigsten auftretender Wert) – betrachtet. Diese drei Lagemaße wollen wir uns daher auch in diesem (Mittel) sowie im nächsten Beitrag dieser Blog-Reihe (Median, Modus) näher ansehen.
Wie wir bereits gelernt haben, entscheidet sich die Frage, welches Lagemaß für eine beliebige Verteilung berechnet werden kann, am Skalenniveau der Daten. Dabei ist zu beachten, dass Lagemaße zwar „aufwärtskomptibel“, nicht aber „abwärtskompatibel“ sind. Liegen also metrisch skalierte Daten vor, kann neben dem arithmetischen Mittel auch der Median, oder (falls die Verteilung ein eindeutiges Maximum aufweist – mehr dazu nächste Woche) der Modus berechnet werden – liegen dagegen lediglich ordinalskalierte Daten vor, ist die Berechnung des arithmetischen Mittels definitiv nicht möglich. Lagemaße, die ein niedrigeres Skalenniveau voraussetzen, können also auch auf Daten eines höheren Skalenniveaus angewandt werden – dies gilt jedoch nicht umgekehrt. Die nachfolgende Grafik verdeutlicht noch einmal, welches Lagemaß ab welchem Skalenniveau zum Einsatz kommen kann.
Anzeige
Black Friday bei Amazon. Spare 50% und mehr bei Technikartikeln
Hier findest Du top bewertete Artikel mit einem Rabatt von 50% bis 90%.Tablets, Speichermedien, Notebooks, Kopfhörer, Software, Lautsprecher und vieles mehr zu Schnäppchenpreisen!
Limitierte Black Friday Angebote!
Das arithmetische Mittel
Wir beginnen mit dem arithmetischen Mittel, das als das bekannteste Lagemaß häufig auch als „das Standardmittel“ oder einfach nur als „der Mittelwert“ oder „der Durchschnitt“ bezeichnet wird. Seine Berechnung setzt voraus, dass die Daten der Verteilung mindestens metrisch skaliert sind – was in der Praxis (etwa bei Schulnoten) bedauerlicherweise häufig übersehen wird. Ist diese Vorbedingung erfüllt, berechnet sich das arithmetische Mittel durch die Bildung der Summe aller Werte einer Verteilung sowie durch die anschließende Division dieser Summe durch die Gesamtzahl der aufaddierten Werte:
mit:
xi = Einzelner Wert der Verteilung
n = Anzahl der Werte der Verteilung
Arithmetisches Mittel bei klassierten Daten
Neben der „einfachen“ Berechnung des arithmetischen Mittels kann für die eine oder andere Klausur durchaus auch noch die Berechnung des arithmetischen Mittels bei klassierten Daten von Relevanz sein. Hierfür wird auf folgende Formel zurückgegriffen:
mit:
fi = Relative Häufigkeit der Klasse i
mi = Klassenmitte der Klasse i
k = Anzahl der Klassen
Robustheit und getrimmtes arithmetisches Mittel
Das arithmetische Mittel wird von (univariaten) Ausreißern (besonders großen oder kleinen Werten im Datensatz) ganz erheblich beeinflusst und wird deshalb auch als „nicht robust“ bezeichnet. Diesen Effekt kann man sich leicht vor Augen führen, indem man sich klarmacht, dass das arithmetische Mittel der (Mini-) Verteilung [1; 2; 3; 4] bei 2,5 liegt, das arithmetische Mittel der Verteilung [1; 2; 3; 50] aber schon bei 14. Bereits ein einzelner sehr großer oder kleiner Wert (wie etwa ein exorbitantes Einkommen bei einer Vermögenserhebung), kann dieses Lagemaß also deutlich nach oben oder unten verzerren.
Um diesen Effekt zu begrenzen, kann man entweder auf ein anderes Lagemaß (wie etwa den Median) ausweichen, oder das sogenannte getrimmte arithmetische Mittel berechnen. Hierbei wird der Datensatz vor der Berechnung des arithmetischen Mittels um eine gewisse Anzahl von Werten an den Rändern der Verteilung (symmetrisch) gekürzt, um Ausreißer aus dem Datensatz zu eliminieren. Bei einem Datensatz mit 100 Werten würden bei einer Trimmung um 5% zum Beispiel die 5 größten sowie die 5 kleinsten Werte aus dem Datensatz entfernt und anschließend das arithmetische Mittel auf Basis der bereits bekannten Formel neu berechnet. Dabei ist zu beachten, dass in vielen Fällen auch Nicht-Ausreißer gestrichen werden, die man im Grunde aber für weitere Analysen (Vergleichbarkeit der Ergebnisse) beibehalten möchte.
Hinweis zu softwaregestützten Analysen
Wird für die Berechnung des arithmetischen Mittels eine Software wie etwa SPSS, PSPP oder PAST eingesetzt, so ist – wie bei vielen anderen Berechnungen auch – zu berücksichtigen, dass die Erfüllung von Vorbedingungen für die Analyse in der Regel nicht von der Software geprüft wird. In diesem Fall betrifft dies insbesondere das Vorliegen eines metrischen Skalenniveaus. SPSS berechnet das arithmetische Mittel fälschlicherweise also nicht nur für Schulnoten, sondern auch für Telefonnummern oder Geschlechter (falls diese mit Zahlen codiert sein sollten) – auch wenn die Ergebnisse vollkommen sinnbefreit sind. Als ganz besonders gefährlich dürfen dabei übrigens solche Fehler betrachtet werden, die – zumindest oberflächlich gesehen – sinnvolle Ergebnisse darzustellen scheinen (wie eben das arithmetische Mittel aus Schulnoten). Beim Einsatz von Software ist daher entscheidend, dass der Anwender / die Anwenderin über die Methodenkenntnisse verfügt, um beurteilen zu können, wann eine Methode zulässig ist.
Beispielrechnungen
Arithmetisches Mittel
Für eine Gruppe von Studierenden liegt folgende Altersverteilung vor:
Das arithmetische Mittel berechnet sich in diesem Fall wie folgt:
21+21+21+21+21+22+22+22+22+23+23+23+24+24+24+24+25+25+25+25 = 458
458 / 20 = 22,9
Alternative Vereinfachung:
(21*5) + (22*4) + (23*3) + (24*4) + (25*4) = 458
458 / 20 = 22,9
Das arithmetische Mittel liegt somit bei 22,9 Jahren.
Arithmetisches Mittel bei klassierten Daten
Für eine Gruppe von Studierenden liegt folgende Größenverteilung vor:
Das arithmetische Mittel berechnet sich in diesem Fall wie folgt:
(0,24 * 1,60) + (0,32 * 1,70) + (0,44 * 1,80) = 1,72
Das arithmetische Mittel liegt somit bei 1,72 Metern.
Getrimmtes arithmetisches Mittel
Eine Umfrage unter 10 Personen zum monatlichen Bruttoeinkommen erbrachte folgende Ergebnisse:
Das arithmetische Mittel berechnet sich in diesem Fall wie folgt:
2250 + 2320 + 2400 + 2140 + 17380 + 2130 + 2640 + 2550 + 2250 + 2710 = 38770
38770 / 10 = 3877
Das arithmetische Mittel liegt bei 3.877 EUR. Da es offenkundig vom Ausreißer stark beeinflusst wird (alle befragten Personen außer einer verdienen zwischen 2.100 EUR und 2.800 EUR – trotzdem liegt der „Mittelwert“ bei fast 4.000 EUR), soll nachfolgend noch das um 10% getrimmte arithmetische Mittel berechnet werden.
Bei einer 10%igen Trimmung sind der größte (17.380 EUR) und der kleinste (2.130 EUR) Wert aus dem Datensatz zu entfernen. Es ergibt sich die folgende neue Grundtabelle:
Das getrimmte arithmetische Mittel berechnet sich dann wie folgt:
2250 + 2320 + 2400 + 2140 + 2640 + 2550 + 2250 + 2710 = 19260
19260 / 8 = 2407,5
Das getrimmte arithmetische Mittel liegt somit (deutlich realitätsnäher) bei 2.407,50 EUR.
Übungsaufgaben
Arithmetisches Mittel
Aus einem Produktionslos von 1.000 Karosserieteilen wird eine Stichprobe von 20 Teilen gezogen und gewogen. Es ergeben sich die folgenden Werte:
a) Fassen Sie diese Werte in einer kumulierten Häufigkeitstabelle (ohne Klassierung) zusammen.
b) Berechnen Sie das arithmetische Mittel.
Arithmetisches Mittel bei klassierten Daten
Eine Gruppe von 50 Studierenden wird nach ihrem ungefähren Lernaufwand für eine Statistikklausur (in Tagen) befragt. Es ergeben sich die folgenden (klassierten) Werte:
a) Füllen Sie den Rest der kumulierten Häufigkeitstabelle aus.
b) Berechnen Sie das arithmetische Mittel.
Getrimmtes arithmetisches Mittel
Eine Gruppe von Studierenden befragt Passantinnen und Passanten auf dem Campus. Erhoben wird dabei unter anderem das Alter (in Jahren). Hierfür ergeben sich für 20 Personen folgende Werte:
a) Berechnen Sie das um 5% getrimmte arithmetische Mittel.
b) Berechnen Sie das um 10% getrimmte arithmetische Mittel.
Zur Anzeige der Lösungen bitte hier klicken.
Die hier vorgestellten Inhalte und Aufgaben sind Teil der Vorlesung „Grundlagen der Statistik“ im berufsbegleitenden Bachelor-Studiengang Betriebswirtschaftslehre an der Hochschule Harz. Eine vollständige Übersicht aller Inhalte dieser Vorlesung im Wissenschafts-Thurm findet sich hier: Grundlagen der Statistik.
Mir fehlte noch der Hinweis, dass auch bei metrischen Daten eine Reduktion auf das Mittel evtl auch nur sinnvoll ist bzw. die dadurch erweckten Erwartungen erfüllt, wenn die Verteilung wenigstens annähernd normal ist.
Mein Lieblingsgegenbeispiel ist die durchschnittliche Zahl der Beine der Deutschen und insbesondere die Feststellung, dass fast alle überdurchschnittlich viele Beine haben.
Absolut richtiger Hinweis – vielen Dank für die Ergänzung. In der Endfassung des Skripts für die Studierenden sollte ich unbedingt noch einen entsprechenden Hinweis aufnehmen…
Hallo Herr Reinboth,
Wenn ich jetzt aber den Mittelwert errechnen möchte, wenn ich Altersangaben wie 17- 20, 21- 24 etc habe kann ich dass dann überhaupt bzw wie gehe ich da vor bzw werte solche Altersklassen statistisch aus?
@Deborah Wenzel: Ja, das ist möglich – das arithmetische Mittel lässt sich auch bei klassierten Daten auf Basis der relativen Häufigkeiten sowie der Klassenmitten berechnen. Angenommen, Sie haben folgende Altersverteilung:
[20 – 24) Jahre: 9 Personen (36% der Stichprobe) -> Klassenmitte: 22 Jahre
[24 – 28) Jahre: 16 Personen (64% der Stichprobe) -> Klassenmitte: 26 Jahre
In diesem Fall rechnen Sie:
(22 * 0,36) + (26 * 0,64) = 24,56
Pingback: Klar Soweit? No.50 – Fifty-Fifty - Augenspiegel
Wäre es nicht einfacher das arithmetische Mittel bei Klassierten Daten mit der echten Häufigkeit und nicht der relativen Häufigkeit anzugeben? Dann ähnelt die Formel viel klarer der des arithmetischen Mittel bei nicht klassierten Daten, da man die Summe aus den mittleren Werten und ihrer Anzahl ebenso mit 1/k multipliziert.
@Steffen Schnitzer: Ein interessanter Ansatz! Im Grunde ist das ja der gleiche Rechenweg (nur mit einem zusätzlichen Rechenschritt) – der dann auch zum gleichen Ergebnis führt:
Klasse I: 10-19: 4 Werte
Klasse II: 20-29: 6 Werte
Methode I: 14,5 * 0,4 + 24,5 * 0,6 = 5,8 + 14,7 = 20,5
Methode II: 14,5 * 4 + 24,5 * 6 = 58 + 147 = 205 -> 205 / 10 = 20,5
Welche Formel einem besser gefällt, kann man sich also in der Tat frei aussuchen…