Suche
Suche Menü

Übungsaufgabe zur Box-Plot-Konstruktion: Altersangaben

AUFGABE

Die nachfolgende Tabelle enthält zehn Datensätze aus einer Studierendenbefragung, die auf dem Campus der Hochschule Harz durchgeführt wurde. Gefragt wurde (unter anderem) nach Alter, (biologischem) Geschlecht, monatlich verfügbarem Nettoeinkommen und gewähltem Studiengang.

Nr.AlterGeschlechtEinkommenStudiengang
121 Jahremännlich580,00 EURBWL
220 Jahremännlich420,00 EURBWL
323 Jahreweiblich230,00 EURInformatik
428 Jahremännlich450,00 EURMedienkonzeption
520 Jahreweiblich380,00 EURMedienkonzeption
627 Jahreweiblich450,00 EURInformatik
733 Jahremännlich320,00 EURInformatik
821 Jahreweiblich410,00 EURBWL
922 Jahreweiblich280,00 EURBWL
1019 Jahreweiblich260,00 EURMedienkonzeption

Zeichen Sie einen erweiterten Box-Plot für das Alter und geben Sie die für die Konstruktion erforderlichen Größen an. Wie alt müsste ein zusätzlicher (!) Proband mindestens (!) sein, um im Box-Plot als Ausreißer am oberen Rand der Verteilung ausgewiesen zu werden?

Der für die Lösung dieser Aufgabe erforderliche theoretische Hintergrund lässt sich hier noch einmal nachlesen. Die Musterlösung findet sich dann unterhalb des Pfeils.

PfeilMUSTERLÖSUNG

Vorbereitender Schritt: Ordnen der Werte

Wert19202021212223272833
Stelle1.2.3.4.5.67.8.9.10.

Erster Schritt: Konstruktion der Box mittels der Quartile

Perzentil Formel nicht ganzzahlig(wenn n * p keinen ganzzahligen Wert ergibt)

Perzentil Formel ganzzahlig(wenn n * p einen ganzzahligen Wert ergibt)

Unteres Quartil: 0,25 * 10 = 2,5 -> Wert an 3. Stelle der geordneten Verteilung -> 20
Mittleres Quartil bzw. Median: 0,50 * 10 = 5 -> Mittel aus den beiden Werten an 5. und 6. Stelle der geordneten Verteilung -> (21 + 22) / 2 = 21,5
Oberes Quartil: 0,75 * 10 = 7,5 -> Wert an 8. Stelle der geordneten Verteilung -> 27
Interquartilsabstand (IQR): 27 – 20 = 7

Die Box verläuft somit von 20 auf 27, der Median wird bei 21,5 eingezeichnet.

Zweiter Schritt: Konstruktion der Zäune mittels IQR

1,5-facher Interquartilsabstand (IQR): 7 * 1,5 = 10,5
Der untere Zaun läuft minimal bis: 20 – 10,5 = 9,5
-> kleinster Wert in diesem  Wertebereich ist die 19
Der obere Zaun läuft maximal bis: 27 + 10,5 = 37,5
-> größter Wert in diesem Wertebereich ist die 33

Der untere Zaun läuft somit bis zur 19, der obere Zaun bis zur 33.

Dritter Schritt: Identifikation der Ausreißer mittels IQR

(entfällt, da die Zäune bereits den größten und kleinsten Wert im Datensatz einschließen)

Box-Plot Alter

Erweiterter Box-Plot für das Alter (erstellt mit SSP).

Wie alt müsste ein zusätzlicher Proband sein, um als Ausreißer gewertet zu werden?

Die simple Antwort ohne Ergänzung der Verteilung lautet: Mindestens 38 Jahre.

Für die komplexe (und bessere) Antwort ist zu berücksichtigen, dass die Ergänzung des Datensatzes um einen weiteren Probanden hohen Alters die Neuberechnung des IQR sowie der maximalen Grenze des oberen Zauns erforderlich macht. Dabei spielt es aufgrund der Robustheit der für die Konstruktion des Box-Plots verwendeten Kennzahlen keine Rolle, welchen konkreten Wert man diesem Ausreißer zuweist. Diese Neubestimmung ergibt:

Unteres Quartil: 0,25 * 11 = 2,75 -> Wert an 3. Stelle der geordneten Verteilung -> 20
Oberes Quartil: 0,75 * 11 = 8,25 -> Wert an 9. Stelle der geordneten Verteilung -> 28
Interquartilsabstand (IQR): 28 – 20 = 8
1,5-facher IQR = 1,5 * 8 = 12
Der obere Zaun läuft somit maximal bis 28 + 12 = 40.

Ein Ausreißer müsste also mindestens 41 Jahre alt sein (wenn nur vollendete Lebensjahre angegeben werden).

>>> Zurück zur Übersichtsseite Statistik.


Diese Übungsaufgabe stammt aus der Vorlesung “Grundlagen der Statistik” von Christian Reinboth im berufsbegleitenden Bachelor-Studiengang BWL an der Hochschule Harz.