Statistik

Grundlagen der Statistik: Statistische Lagemaße – das arithmetische Mittel

Die statistischen Lagemaße werden auch als Mittelwerte oder Maße der zentralen Tendenz bezeichnet. Sie geben Auskunft über das Zentrum einer Verteilung und sind insbesondere dann gefragt, wenn es gilt, eine Verteilung mit nur einem Parameter zusammenzufassen – wie etwa die Einkommensverteilung mit der Angabe des Durchschnittseinkommens. (Warum nur ein Parameter für die Darstellung einer Verteilung in der Regel eben nicht ausreicht, wird in einem der nächsten Blogposts zum Thema Streuungsmaße erläutert.) Im Rahmen der meisten Vorlesungen werden insbesondere drei Lagemaße – das arithmetische Mittel (der “Durchschnittswert” der Verteilung), der Median (der Wert genau in der Mitte der geordneten Verteilung) und der Modus (der in der Verteilung am häufigsten auftretender Wert) – betrachtet. Diese drei Lagemaße wollen wir uns daher auch in diesem (Mittel) sowie im nächsten Beitrag dieser Blog-Reihe (Median, Modus) näher ansehen.

Wie wir bereits gelernt haben, entscheidet sich die Frage, welches Lagemaß für eine beliebige Verteilung berechnet werden kann, am Skalenniveau der Daten. Dabei ist zu beachten, dass Lagemaße zwar „aufwärtskomptibel“, nicht aber „abwärtskompatibel“ sind. Liegen also metrisch skalierte Daten vor, kann neben dem arithmetischen Mittel auch der Median, oder (falls die Verteilung ein eindeutiges Maximum aufweist – mehr dazu nächste Woche) der Modus berechnet werden – liegen dagegen lediglich ordinalskalierte Daten vor, ist die Berechnung des arithmetischen Mittels definitiv nicht möglich. Lagemaße, die ein niedrigeres Skalenniveau voraussetzen, können also auch auf Daten eines höheren Skalenniveaus angewandt werden – dies gilt jedoch nicht umgekehrt. Die nachfolgende Grafik verdeutlicht noch einmal, welches Lagemaß ab welchem Skalenniveau zum Einsatz kommen kann.

Anzeige

Das arithmetische Mittel

Wir beginnen mit dem arithmetischen Mittel, das als das bekannteste Lagemaß häufig auch als „das Standardmittel“ oder einfach nur als „der Mittelwert“ oder “der Durchschnitt” bezeichnet wird. Seine Berechnung setzt voraus, dass die Daten der Verteilung mindestens metrisch skaliert sind – was in der Praxis (etwa bei Schulnoten) bedauerlicherweise häufig übersehen wird. Ist diese Vorbedingung erfüllt, berechnet sich das arithmetische Mittel durch die Bildung der Summe aller Werte einer Verteilung sowie durch die anschließende Division dieser Summe durch die Gesamtzahl der aufaddierten Werte:

mit:

xi = Einzelner Wert der Verteilung
n = Anzahl der Werte der Verteilung

Arithmetisches Mittel bei klassierten Daten

Neben der „einfachen“ Berechnung des arithmetischen Mittels kann für die eine oder andere Klausur durchaus auch noch die Berechnung des arithmetischen Mittels bei klassierten Daten von Relevanz sein. Hierfür wird auf folgende Formel zurückgegriffen:

mit:

fi = Relative Häufigkeit der Klasse i
mi = Klassenmitte der Klasse i
k = Anzahl der Klassen

Robustheit und getrimmtes arithmetisches Mittel

Das arithmetische Mittel wird von (univariaten) Ausreißern (besonders großen oder kleinen Werten im Datensatz) ganz erheblich beeinflusst und wird deshalb auch als „nicht robust“ bezeichnet. Diesen Effekt kann man sich leicht vor Augen führen, indem man sich klarmacht, dass das arithmetische Mittel der (Mini-) Verteilung [1; 2; 3; 4] bei 2,5 liegt, das arithmetische Mittel der Verteilung [1; 2; 3; 50] aber schon bei 14. Bereits ein einzelner sehr großer oder kleiner Wert (wie etwa ein exorbitantes Einkommen bei einer Vermögenserhebung), kann dieses Lagemaß also deutlich nach oben oder unten verzerren.

Um diesen Effekt zu begrenzen, kann man entweder auf ein anderes Lagemaß (wie etwa den Median) ausweichen, oder das sogenannte getrimmte arithmetische Mittel berechnen. Hierbei wird der Datensatz vor der Berechnung des arithmetischen Mittels um eine gewisse Anzahl von Werten an den Rändern der Verteilung (symmetrisch) gekürzt, um Ausreißer aus dem Datensatz zu eliminieren. Bei einem Datensatz mit 100 Werten würden bei einer Trimmung um 5% zum Beispiel die 5 größten sowie die 5 kleinsten Werte aus dem Datensatz entfernt und anschließend das arithmetische Mittel auf Basis der bereits bekannten Formel neu berechnet. Dabei ist zu beachten, dass in vielen Fällen auch Nicht-Ausreißer gestrichen werden, die man im Grunde aber für weitere Analysen (Vergleichbarkeit der Ergebnisse) beibehalten möchte.

Hinweis zu softwaregestützten Analysen

Wird für die Berechnung des arithmetischen Mittels eine Software wie etwa SPSS, PSPP oder PAST eingesetzt, so ist – wie bei vielen anderen Berechnungen auch – zu berücksichtigen, dass die Erfüllung von Vorbedingungen für die Analyse in der Regel nicht von der Software geprüft wird. In diesem Fall betrifft dies insbesondere das Vorliegen eines metrischen Skalenniveaus. SPSS berechnet das arithmetische Mittel fälschlicherweise also nicht nur für Schulnoten, sondern auch für Telefonnummern oder Geschlechter (falls diese mit Zahlen codiert sein sollten) – auch wenn die Ergebnisse vollkommen sinnbefreit sind. Als ganz besonders gefährlich dürfen dabei übrigens solche Fehler betrachtet werden, die – zumindest oberflächlich gesehen – sinnvolle Ergebnisse darzustellen scheinen (wie eben das arithmetische Mittel aus Schulnoten). Beim Einsatz von Software ist daher entscheidend, dass der Anwender / die Anwenderin über die Methodenkenntnisse verfügt, um beurteilen zu können, wann eine Methode zulässig ist.

Beispielrechnungen

Arithmetisches Mittel

Für eine Gruppe von Studierenden liegt folgende Altersverteilung vor:

Das arithmetische Mittel berechnet sich in diesem Fall wie folgt:

21+21+21+21+21+22+22+22+22+23+23+23+24+24+24+24+25+25+25+25 = 458

458 / 20 = 22,9

Alternative Vereinfachung:

(21*5) + (22*4) + (23*3) + (24*4) + (25*4) = 458

458 / 20 = 22,9

Das arithmetische Mittel liegt somit bei 22,9 Jahren.

Arithmetisches Mittel bei klassierten Daten

Für eine Gruppe von Studierenden liegt folgende Größenverteilung vor:

Das arithmetische Mittel berechnet sich in diesem Fall wie folgt:

(0,24 * 1,60) + (0,32 * 1,70) + (0,44 * 1,80) = 1,72

Das arithmetische Mittel liegt somit bei 1,72 Metern.

Getrimmtes arithmetisches Mittel

Eine Umfrage unter 10 Personen zum monatlichen Bruttoeinkommen erbrachte folgende Ergebnisse:

Das arithmetische Mittel berechnet sich in diesem Fall wie folgt:

2250 + 2320 + 2400 + 2140 + 17380 + 2130 + 2640 + 2550 + 2250 + 2710 = 38770

38770 / 10 = 3877

Das arithmetische Mittel liegt bei 3.877 EUR. Da es offenkundig vom Ausreißer stark beeinflusst wird (alle befragten Personen außer einer verdienen zwischen 2.100 EUR und 2.800 EUR – trotzdem liegt der „Mittelwert“ bei fast 4.000 EUR), soll nachfolgend noch das um 10% getrimmte arithmetische Mittel berechnet werden.

Bei einer 10%igen Trimmung sind der größte (17.380 EUR) und der kleinste (2.130 EUR) Wert aus dem Datensatz zu entfernen. Es ergibt sich die folgende neue Grundtabelle:

Das getrimmte arithmetische Mittel berechnet sich dann wie folgt:

2250 + 2320 + 2400 + 2140 + 2640 + 2550 + 2250 + 2710 = 19260

19260 / 8 = 2407,5

Das getrimmte arithmetische Mittel liegt somit (deutlich realitätsnäher) bei 2.407,50 EUR.

Übungsaufgaben

Arithmetisches Mittel

Aus einem Produktionslos von 1.000 Karosserieteilen wird eine Stichprobe von 20 Teilen gezogen und gewogen. Es ergeben sich die folgenden Werte:

a) Fassen Sie diese Werte in einer kumulierten Häufigkeitstabelle (ohne Klassierung) zusammen.
b) Berechnen Sie das arithmetische Mittel.

Arithmetisches Mittel bei klassierten Daten

Eine Gruppe von 50 Studierenden wird nach ihrem ungefähren Lernaufwand für eine Statistikklausur (in Tagen) befragt. Es ergeben sich die folgenden (klassierten) Werte:

a) Füllen Sie den Rest der kumulierten Häufigkeitstabelle aus.
b) Berechnen Sie das arithmetische Mittel.

Getrimmtes arithmetisches Mittel

Eine Gruppe von Studierenden befragt Passantinnen und Passanten auf dem Campus. Erhoben wird dabei unter anderem das Alter (in Jahren). Hierfür ergeben sich für 20 Personen folgende Werte:

a) Berechnen Sie das um 5% getrimmte arithmetische Mittel.
b) Berechnen Sie das um 10% getrimmte arithmetische Mittel.

Zur Anzeige der Lösungen bitte hier klicken.


Die hier vorgestellten Inhalte und Aufgaben sind Teil der Vorlesung “Grundlagen der Statistik” im berufsbegleitenden Bachelor-Studiengang Betriebswirtschaftslehre an der Hochschule Harz. Eine vollständige Übersicht aller Inhalte dieser Vorlesung im Wissenschafts-Thurm findet sich hier: Grundlagen der Statistik.

Christian Reinboth

Christian Reinboth ist Wirtschaftsinformatiker und einer der Mit-Gründer der HarzOptics GmbH, einem An-Institut der Hochschule Harz. Die Entwicklung und Planung umweltfreundlicher Beleuchtung sowie die statistische Datenanalyse sind wesentliche Schwerpunkte seiner Forschungs- und Lehrtätigkeit.

View Comments

  • Mir fehlte noch der Hinweis, dass auch bei metrischen Daten eine Reduktion auf das Mittel evtl auch nur sinnvoll ist bzw. die dadurch erweckten Erwartungen erfüllt, wenn die Verteilung wenigstens annähernd normal ist.

    Mein Lieblingsgegenbeispiel ist die durchschnittliche Zahl der Beine der Deutschen und insbesondere die Feststellung, dass fast alle überdurchschnittlich viele Beine haben.

    • Absolut richtiger Hinweis - vielen Dank für die Ergänzung. In der Endfassung des Skripts für die Studierenden sollte ich unbedingt noch einen entsprechenden Hinweis aufnehmen...

  • Hallo Herr Reinboth,

    Wenn ich jetzt aber den Mittelwert errechnen möchte, wenn ich Altersangaben wie 17- 20, 21- 24 etc habe kann ich dass dann überhaupt bzw wie gehe ich da vor bzw werte solche Altersklassen statistisch aus?

  • @Deborah Wenzel: Ja, das ist möglich - das arithmetische Mittel lässt sich auch bei klassierten Daten auf Basis der relativen Häufigkeiten sowie der Klassenmitten berechnen. Angenommen, Sie haben folgende Altersverteilung:

    [20 - 24) Jahre: 9 Personen (36% der Stichprobe) -> Klassenmitte: 22 Jahre
    [24 - 28) Jahre: 16 Personen (64% der Stichprobe) -> Klassenmitte: 26 Jahre

    In diesem Fall rechnen Sie:

    (22 * 0,36) + (26 * 0,64) = 24,56

  • Wäre es nicht einfacher das arithmetische Mittel bei Klassierten Daten mit der echten Häufigkeit und nicht der relativen Häufigkeit anzugeben? Dann ähnelt die Formel viel klarer der des arithmetischen Mittel bei nicht klassierten Daten, da man die Summe aus den mittleren Werten und ihrer Anzahl ebenso mit 1/k multipliziert.

    • @Steffen Schnitzer: Ein interessanter Ansatz! Im Grunde ist das ja der gleiche Rechenweg (nur mit einem zusätzlichen Rechenschritt) - der dann auch zum gleichen Ergebnis führt:

      Klasse I: 10-19: 4 Werte
      Klasse II: 20-29: 6 Werte

      Methode I: 14,5 * 0,4 + 24,5 * 0,6 = 5,8 + 14,7 = 20,5
      Methode II: 14,5 * 4 + 24,5 * 6 = 58 + 147 = 205 -> 205 / 10 = 20,5

      Welche Formel einem besser gefällt, kann man sich also in der Tat frei aussuchen...

Recent Posts

Neues Projekt vom Team Thurm gestartet

Der Erfolg des Buches "Traumreisen mit dem Luftschiff" von Thurm-Autor Horst Kleinert brachte uns auf…

1 Jahr ago

Neuerscheinung im Thurm-Verlag

50 Tipps und Tricks für die erfolgreiche Bearbeitung und fehlerarme Verausgabung von Fördermitteln in der…

1 Jahr ago

Was sich in meinen Intentionen spiegelt – Frau Professorin Dr. Elisabeth Lukas zum 80. Geburtstag

Am 12.11.2022 vollendet Frau Professorin Dr. Lukas ihr 80. Lebensjahr. Grund genug, ihr von Herzen…

1 Jahr ago

Neuerscheinung im Thurm-Verlag

Was sich in meinen Intentionen spiegeltFestschrift für Elisabeth Lukas Svetlana Shtukareva , Alexander Vesely, Alexander…

2 Jahren ago

Interesse am deep-nature Glamping in Deutschland

von Sven Groß, Jana Culemann und Juliane Rebbe Glamping - Begriff und Entwicklung Glamping ist…

2 Jahren ago

Neuerscheinung im Thurm-Verlag

Horst KleinertOperation LazarusErzählungen Drei spannende Kurzgeschichten über den Mut, der Menschen über sich hinauswachsen lässt.…

2 Jahren ago