Suche
Suche Menü

Kostenlose Alternativen zu SPSS für Studierende – was können PAST, PSPP & Co.?

Blue infographics documents with 3D graphs and charts of glass.

Wer im Rahmen eines Studiums eine weiterführende Statistik-Vorlesung – wie etwa Marktforschung oder Meinungsforschung – belegt, wird mit großer Wahrscheinlichkeit mit SPSS auch eines der marktführenden Softwareprodukte für die statistische Datenanalyse kennenlernen. SPSS wurde schon 1983 (damals als „Statistical Package for Social Sciences“) als Analysetool für die Sozialwissenschaften auf den Markt gebracht – die Bedeutung der namensgebenden Abkürzung hat sich seitdem bereits mehrfach geändert. Seit 2009 wird die Software von IBM unter dem Label IBM SPSS Statistics vertrieben.

SPSS bietet ein breites Spektrum an Verfahren zur statistischen Analyse von Daten – von der multivariaten Regression über die Faktoranalyse und die Varianzanalyse bis hin zur Clusteranalyse – und ermöglicht die Erstellung einer Vielzahl von aussagekräftigen Grafiken. Obwohl die Software zweifellos hervorragend ist – nicht ohne Grund kommt sie in vielen Unternehmen und Behörden weltweit zum Einsatz – hat sie für Studierende einen nicht von der Hand zu weisenden Nachteil: Den Preis.

Zwar kann man hier mit zeitlich befristeten Testversionen oder SPSS-Übungsräumen, zu denen Studierende sich die Schlüssel ausleihen können, begrenzt Abhilfe schaffen – dennoch möchte man für die Klausur ja sicher manchmal gerne auch am heimischen Laptop üben oder die Daten für den empirischen Teil der eigenen Bachelorarbeit mit einer Vollversion ohne zeitliche oder gar funktionale Einschränkungen auswerten können. Erfreulicherweise existieren gleich mehrere gute kostenfreie bzw. kostengünstige Alternativen zu SPSS. Drei davon, die mich persönlich ganz besonders überzeugt haben, sollen in diesem Blogbeitrag nachfolgend kurz betrachtet werden.

PAST

Berechnung deskriptiver Kennzahlen wie arithmetisches Mittel, Median, Varianz und Standardabweichung mit PAST (zum Vergrößern bitte auf die Grafik klicken)

Den wohl ungewöhnlichsten fachlichen Hintergrund dieser drei Softwarealternativen hat PAST – eine kostenfreie Statistiksoftware, die derzeit in der Version 3.11 vorliegt und sowohl auf Windows-Rechnern (sogar ohne Installation vom Stick oder aus der Cloud) sowie auf Mac OSX (ab 10.8) lauffähig ist. Das Akronym steht für „PAleontological STatistics“ und impliziert bereits, dass die Software ursprünglich für Datenanalysen in der Paläontologie – so etwa für die stratigraphische Datierung von Gesteinen – entwickelt wurde. Da der „Methodenkoffer“ der Statistik jedoch sowohl für Paläontologen als auch für Markt- und Meinungsforscher, Sozialwissenschaftler oder Qualitätsmanager im Grunde – von einigen Sonderverfahren einmal abgesehen – der gleiche ist, eignet sich PAST auch für den Einsatz in anderen Fachdisziplinen.

Zum methodischen Funktionsumfang der Software gehören unter anderem T-Tests und F-Tests, die Korrelationskoeffizienten nach Pearson, Spearman und Kendall, die (multivariate) lineare Regression sowie die Cluster- und Zeitreihenanalyse. Auf der grafischen Seite lassen sich neben den gängigen visuellen Darstellungsformen wie Balken- und Tortendiagrammen auch Histogramme, Box-Plots und Streudiagramm-Matrizen generieren.

Persönlich habe ich mit der von Øyvind Hammer an der Universität von Oslo entwickelten Software schon häufig gearbeitet und kann einen näheren Blick auf PAST nur jedem ans Herz legen, der eine kostenfreie und dennoch gute Alternative zu Marktführern wie SPSS oder SAS sucht. Für Anwender/innen, die bereits mit SPSS vertraut sind, ist die Bedienung im ersten Moment zwar ein wenig gewöhnungsbedürftig (so selektiert man beispielsweise die zu analysierenden Datenspalten noch vor Auswahl der auszuführenden Funktionen im Datenfenster), mit der Zeit arbeitet man sich aber gut ein. Und auch der einzige echte Nachteil von PAST – die nur auf Englisch verfügbare Benutzeroberfläche – ist für engagierte Studierende eigentlich eher ein Vorteil, lernt man auf diesem Wege doch gleich auch noch die für die Lektüre internationaler Fachpublikationen im weiterführenden Studium ohnehin benötigten englischen Entsprechungen wichtiger statistischer Fachbegriffe kennen.

Clusteranalyse

Das Ergebnis einer hierarchischen Clusteranalyse (hier in From eines Dendrogramms) in PAST (zum Vergrößern bitte auf die Grafik klicken)

Ebenfalls kostenfrei erhältlich ist die Software PSPP, deren Name nicht ohne Grund an SPSS erinnert. Das PSPP-Projekt wurde Ende der 1990er von einigen verärgerten SPSS-Nutzern als Reaktion auf die zeitliche Befristung der SPSS-Lizenzmodelle ins Leben gerufen und wird seitdem unter einer freien GNU-Lizenz weiterentwickelt. Die Software orientiert sich hinsichtlich Funktionsumfang und „Look and Feel“ ganz bewusst an SPSS, so dass mit SPSS vertraute Anwender/innen beim Umstieg keine Schwierigkeiten haben werden. Im Gegensatz zu PAST ist PSPP plattformunabhängig (und damit auch auf Linux-Systemen lauffähig) und verfügt über eine deutschsprachige Benutzeroberfläche.

Einige Abstriche im Vergleich zu SPSS muss man bei PSPP allerdings hinnehmen. So lassen sich zwar neben umfassenden deskriptiven Datenanalysen unter anderem auch T-Tests, Kolmogoroff-Smirnov-Anpassungstests, Regressionsanalysen, Varianzanalysen, Clusteranalysen und Faktorenanalysen durchführen – auf die Korrespondenzanalyse oder auf die Conjoint-Analyse muss man dagegen verzichten. Dennoch deckt PSPP den Großteil der für die meisten Vorlesungen relevanten SPSS-Funktionalitäten ab, ist in Aussehen und Bedienbarkeit sehr ähnlich und zudem mit den SPSS-Daten- und -Syntaxdateien kompatibel – man kann also die im SPSS-Übungsraum der Hochschule begonnene Datenanalyse problemlos am heimischen Rechner mit PSPP fortsetzen. Studierende, die ein „SPSS für Zuhause“ suchen, sollten sich PSPP daher auf jeden Fall näher ansehen.

PSPP

Statistische Datenanalyse mit PSPP (zum Vergrößern bitte auf die Grafik klicken)

Wer bereit ist, ein wenig Geld für eine gute Statistik-Software auszugeben, wird bei der Gesellschaft Sozialwissenschaftlicher Infrastruktureinrichtungen (GESIS) fündig. Diese vertreibt seit einigen Jahren das vom Norwegian Social Science Data Service (NSD) in Bergen entwickelte Programm NSDstat, das für Studierende bereits ab 45 Euro zu haben ist. NSDstat ist vollständig anders aufgebaut als SPSS (so gibt es beispielsweise komplett getrennte Umgebungen für die Dateneingabe und für die Datenanalyse) und in der Bedienung auf den ersten Blick alles andere als unkompliziert. Dafür verfügt es – ähnlich PSPP – über eine deutschsprachige Benutzeroberfläche und eine wirklich sehr gute deutschsprachige Dokumentation, die neuen Usern die Einarbeitung erheblich erleichtert. Neben den gängigen statistischen Funktionen bietet NSDstat zudem die Möglichkeit, Daten auf geographischen Karten abzubilden – eine Option, die sowohl in PAST als auch in PSPP fehlt. Die Clusteranalyse, die sowohl PAST als auch PSPP beherrschen, ist dagegen bedauerlicherweise nicht Teil des NSDstat-Portfolios.

NSDstat

Erstellung eines einfachen Balkendiagramms bei automatischer Klassenbildung mit NSDstat (zum Vergrößern bitte auf die Grafik klicken)

Zusammengefasst lässt sich feststellen: Ja, es gibt gleich mehrere kostenfreie und kostengünstige Alternativen zu SPSS, mit denen man – je nach Studienrichtung und Fächerwahl – alle oder doch zumindest fast alle relevanten Verfahren abdecken kann. Grundsätzlich sollte bei der Arbeit mit – egal welcher – Software jedoch stets berücksichtigt werden, dass die Erfüllung von Vorbedingungen für statistische Datenanalysen in der Regel nicht vom Programm selbst geprüft wird.

SPSS, PAST, PSPP und NSDstat würden allesamt das arithmetische Mittel fälschlicherweise nicht nur für Schulnoten, sondern auch für Telefonnummern berechnen – selbst wenn die Ergebnisse vollkommen sinnbefreit sind. Als ganz besonders gefährlich dürfen deshalb übrigens solche Fehler betrachtet werden, die – zumindest oberflächlich gesehen – sinnvolle Ergebnisse darzustellen scheinen (wie eben die Berechnung des arithmetischen Mittels aus Schulnoten). Beim Einsatz statistischer Software ist und bleibt daher entscheidend, dass die Anwender/innen über die nötigen Methodenkenntnisse verfügen, um korrekt beurteilen zu können, wann welches analytische Vorgehen zulässig ist.

Autor:

Christian Reinboth

Christian Reinboth ist Wirtschaftsinformatiker und einer der Mit-Gründer der HarzOptics GmbH, einem An-Institut der Hochschule Harz. Die Entwicklung und Planung umweltfreundlicher Beleuchtung sowie die statistische Datenanalyse sind wesentliche Schwerpunkte seiner Forschungs- und Lehrtätigkeit.

2 Kommentare Schreibe einen Kommentar

  1. Was ist eigentlich mit R? Kostenlos und kann alles, was SPSS oder Stata können und zum Teil sogar noch mehr! Jedoch wie PAST keine deutsche Benutzeroberfläche, ja sogar gar kein GUI und keine Menuoberfläche – von Zusatztools wie R-Studio einmal abgesehen – dafür vollständige Kontrolle über alle statistischen Operationen, dank enormer Programmierbarkeit!
    M.E. derzeit die beste kostenfreie Statistikalternative für Studierende.

    Antworten

    • Christian Reinboth

      @Dr. Christian Rademacher: Selbstverständlich ist R eigentlich sogar noch performanter als die diversen hier empfohlenen SPSS-Alternativen, weshalb ich in Vorlesungen auch immer darauf hinweise – in diesem Artikel ging es mir ja aber darum, Software mit GUI vorzustellen, die „out of the box“ und ohne größere Kenntnisse in Programmierung als SPSS-Ersatz eingesetzt werden können. Für Veranstaltungen, in denen man sich mehr Zeit für die Softwareeinführung nehmen kann (oder in denen Studierende mit Grundkenntnissen in Programmierung sitzen), ist R allerdings in der Tat die bessere Alternative.

      Antworten

Schreibe einen Kommentar

Pflichtfelder sind mit * markiert.