Suche
Suche Menü

Grundlagen der Statistik: Statistische Lagemaße – das arithmetische Mittel

Die statistischen Lagemaße werden auch als Mittelwerte oder Maße der zentralen Tendenz bezeichnet. Sie geben Auskunft über das Zentrum einer Verteilung und sind insbesondere dann gefragt, wenn es gilt, eine Verteilung mit nur einem Parameter zusammenzufassen – wie etwa die Einkommensverteilung mit der Angabe des Durchschnittseinkommens. (Warum nur ein Parameter für die Darstellung einer Verteilung in der Regel eben nicht ausreicht, wird in einem der nächsten Blogposts zum Thema Streuungsmaße erläutert.) Im Rahmen der meisten Vorlesungen werden insbesondere drei Lagemaße – das arithmetische Mittel (der „Durchschnittswert“ der Verteilung), der Median (der Wert genau in der Mitte der geordneten Verteilung) und der Modus (der in der Verteilung am häufigsten auftretender Wert) – betrachtet. Diese drei Lagemaße wollen wir uns daher auch in diesem (Mittel) sowie im nächsten Beitrag dieser Blog-Reihe (Median, Modus) näher ansehen.

Wie wir bereits gelernt haben, entscheidet sich die Frage, welches Lagemaß für eine beliebige Verteilung berechnet werden kann, am Skalenniveau der Daten. Dabei ist zu beachten, dass Lagemaße zwar „aufwärtskomptibel“, nicht aber „abwärtskompatibel“ sind. Liegen also metrisch skalierte Daten vor, kann neben dem arithmetischen Mittel auch der Median, oder (falls die Verteilung ein eindeutiges Maximum aufweist – mehr dazu nächste Woche) der Modus berechnet werden – liegen dagegen lediglich ordinalskalierte Daten vor, ist die Berechnung des arithmetischen Mittels definitiv nicht möglich. Lagemaße, die ein niedrigeres Skalenniveau voraussetzen, können also auch auf Daten eines höheren Skalenniveaus angewandt werden – dies gilt jedoch nicht umgekehrt. Die nachfolgende Grafik verdeutlicht noch einmal, welches Lagemaß ab welchem Skalenniveau zum Einsatz kommen kann.

Lagemaße

Das arithmetische Mittel

Wir beginnen mit dem arithmetischen Mittel, das als das bekannteste Lagemaß häufig auch als „das Standardmittel“ oder einfach nur als „der Mittelwert“ oder „der Durchschnitt“ bezeichnet wird. Seine Berechnung setzt voraus, dass die Daten der Verteilung mindestens metrisch skaliert sind – was in der Praxis (etwa bei Schulnoten) bedauerlicherweise häufig übersehen wird. Ist diese Vorbedingung erfüllt, berechnet sich das arithmetische Mittel durch die Bildung der Summe aller Werte einer Verteilung sowie durch die anschließende Division dieser Summe durch die Gesamtzahl der aufaddierten Werte:

Arithmetisches Mittel

mit:

xi = Einzelner Wert der Verteilung
n = Anzahl der Werte der Verteilung

Arithmetisches Mittel bei klassierten Daten

Neben der „einfachen“ Berechnung des arithmetischen Mittels kann für die eine oder andere Klausur durchaus auch noch die Berechnung des arithmetischen Mittels bei klassierten Daten von Relevanz sein. Hierfür wird auf folgende Formel zurückgegriffen:

Klassiertes Mittel

mit:

fi = Relative Häufigkeit der Klasse i
mi = Klassenmitte der Klasse i
k = Anzahl der Klassen

Robustheit und getrimmtes arithmetisches Mittel

Das arithmetische Mittel wird von (univariaten) Ausreißern (besonders großen oder kleinen Werten im Datensatz) ganz erheblich beeinflusst und wird deshalb auch als „nicht robust“ bezeichnet. Diesen Effekt kann man sich leicht vor Augen führen, indem man sich klarmacht, dass das arithmetische Mittel der (Mini-) Verteilung [1; 2; 3; 4] bei 2,5 liegt, das arithmetische Mittel der Verteilung [1; 2; 3; 50] aber schon bei 14. Bereits ein einzelner sehr großer oder kleiner Wert (wie etwa ein exorbitantes Einkommen bei einer Vermögenserhebung), kann dieses Lagemaß also deutlich nach oben oder unten verzerren.

Um diesen Effekt zu begrenzen, kann man entweder auf ein anderes Lagemaß (wie etwa den Median) ausweichen, oder das sogenannte getrimmte arithmetische Mittel berechnen. Hierbei wird der Datensatz vor der Berechnung des arithmetischen Mittels um eine gewisse Anzahl von Werten an den Rändern der Verteilung (symmetrisch) gekürzt, um Ausreißer aus dem Datensatz zu eliminieren. Bei einem Datensatz mit 100 Werten würden bei einer Trimmung um 5% zum Beispiel die 5 größten sowie die 5 kleinsten Werte aus dem Datensatz entfernt und anschließend das arithmetische Mittel auf Basis der bereits bekannten Formel neu berechnet. Dabei ist zu beachten, dass in vielen Fällen auch Nicht-Ausreißer gestrichen werden, die man im Grunde aber für weitere Analysen (Vergleichbarkeit der Ergebnisse) beibehalten möchte.

Hinweis zu softwaregestützten Analysen

Wird für die Berechnung des arithmetischen Mittels eine Software wie etwa SPSS, PSPP oder PAST eingesetzt, so ist – wie bei vielen anderen Berechnungen auch – zu berücksichtigen, dass die Erfüllung von Vorbedingungen für die Analyse in der Regel nicht von der Software geprüft wird. In diesem Fall betrifft dies insbesondere das Vorliegen eines metrischen Skalenniveaus. SPSS berechnet das arithmetische Mittel fälschlicherweise also nicht nur für Schulnoten, sondern auch für Telefonnummern oder Geschlechter (falls diese mit Zahlen codiert sein sollten) – auch wenn die Ergebnisse vollkommen sinnbefreit sind. Als ganz besonders gefährlich dürfen dabei übrigens solche Fehler betrachtet werden, die – zumindest oberflächlich gesehen – sinnvolle Ergebnisse darzustellen scheinen (wie eben das arithmetische Mittel aus Schulnoten). Beim Einsatz von Software ist daher entscheidend, dass der Anwender / die Anwenderin über die Methodenkenntnisse verfügt, um beurteilen zu können, wann eine Methode zulässig ist.

Beispielrechnungen

Arithmetisches Mittel

Für eine Gruppe von Studierenden liegt folgende Altersverteilung vor:

Beispiel Mittelwert

Das arithmetische Mittel berechnet sich in diesem Fall wie folgt:

21+21+21+21+21+22+22+22+22+23+23+23+24+24+24+24+25+25+25+25 = 458

458 / 20 = 22,9

Alternative Vereinfachung:

(21*5) + (22*4) + (23*3) + (24*4) + (25*4) = 458

458 / 20 = 22,9

Das arithmetische Mittel liegt somit bei 22,9 Jahren.

Arithmetisches Mittel bei klassierten Daten

Für eine Gruppe von Studierenden liegt folgende Größenverteilung vor:

Beispiel Mittelwert

Das arithmetische Mittel berechnet sich in diesem Fall wie folgt:

(0,24 * 1,60) + (0,32 * 1,70) + (0,44 * 1,80) = 1,72

Das arithmetische Mittel liegt somit bei 1,72 Metern.

Getrimmtes arithmetisches Mittel

Eine Umfrage unter 10 Personen zum monatlichen Bruttoeinkommen erbrachte folgende Ergebnisse:

Beispiel Mittelwert

Das arithmetische Mittel berechnet sich in diesem Fall wie folgt:

2250 + 2320 + 2400 + 2140 + 17380 + 2130 + 2640 + 2550 + 2250 + 2710 = 38770

38770 / 10 = 3877

Das arithmetische Mittel liegt bei 3.877 EUR. Da es offenkundig vom Ausreißer stark beeinflusst wird (alle befragten Personen außer einer verdienen zwischen 2.100 EUR und 2.800 EUR – trotzdem liegt der „Mittelwert“ bei fast 4.000 EUR), soll nachfolgend noch das um 10% getrimmte arithmetische Mittel berechnet werden.

Bei einer 10%igen Trimmung sind der größte (17.380 EUR) und der kleinste (2.130 EUR) Wert aus dem Datensatz zu entfernen. Es ergibt sich die folgende neue Grundtabelle:

Beispiel Mittelwert

Das getrimmte arithmetische Mittel berechnet sich dann wie folgt:

2250 + 2320 + 2400 + 2140 + 2640 + 2550 + 2250 + 2710 = 19260

19260 / 8 = 2407,5

Das getrimmte arithmetische Mittel liegt somit (deutlich realitätsnäher) bei 2.407,50 EUR.

Übungsaufgaben

Arithmetisches Mittel

Aus einem Produktionslos von 1.000 Karosserieteilen wird eine Stichprobe von 20 Teilen gezogen und gewogen. Es ergeben sich die folgenden Werte:

Beispiel Mittelwert

a) Fassen Sie diese Werte in einer kumulierten Häufigkeitstabelle (ohne Klassierung) zusammen.
b) Berechnen Sie das arithmetische Mittel.

Arithmetisches Mittel bei klassierten Daten

Eine Gruppe von 50 Studierenden wird nach ihrem ungefähren Lernaufwand für eine Statistikklausur (in Tagen) befragt. Es ergeben sich die folgenden (klassierten) Werte:

Beispiel Mittelwert

a) Füllen Sie den Rest der kumulierten Häufigkeitstabelle aus.
b) Berechnen Sie das arithmetische Mittel.

Getrimmtes arithmetisches Mittel

Eine Gruppe von Studierenden befragt Passantinnen und Passanten auf dem Campus. Erhoben wird dabei unter anderem das Alter (in Jahren). Hierfür ergeben sich für 20 Personen folgende Werte:

Beispiel Mittelwert

a) Berechnen Sie das um 5% getrimmte arithmetische Mittel.
b) Berechnen Sie das um 10% getrimmte arithmetische Mittel.

Zur Anzeige der Lösungen bitte hier klicken.


Die hier vorgestellten Inhalte und Aufgaben sind Teil der Vorlesung „Grundlagen der Statistik“ im berufsbegleitenden Bachelor-Studiengang Betriebswirtschaftslehre an der Hochschule Harz.

Autor:

Christian Reinboth

Christian Reinboth ist Wirtschaftsinformatiker und einer der Mit-Gründer der HarzOptics GmbH, einem An-Institut der Hochschule Harz. Die Entwicklung und Planung umweltfreundlicher Beleuchtung sowie die statistische Datenanalyse sind wesentliche Schwerpunkte seiner Forschungs- und Lehrtätigkeit.

2 Kommentare Schreibe einen Kommentar

  1. Mir fehlte noch der Hinweis, dass auch bei metrischen Daten eine Reduktion auf das Mittel evtl auch nur sinnvoll ist bzw. die dadurch erweckten Erwartungen erfüllt, wenn die Verteilung wenigstens annähernd normal ist.

    Mein Lieblingsgegenbeispiel ist die durchschnittliche Zahl der Beine der Deutschen und insbesondere die Feststellung, dass fast alle überdurchschnittlich viele Beine haben.

    Antworten

    • Christian Reinboth

      Absolut richtiger Hinweis – vielen Dank für die Ergänzung. In der Endfassung des Skripts für die Studierenden sollte ich unbedingt noch einen entsprechenden Hinweis aufnehmen…

      Antworten

Schreibe einen Kommentar

Pflichtfelder sind mit * markiert.