SPSS Statistics Open Source Integration

IBM bietet in SPSS Statistics von Haus aus eine umfangreiche Open Source Unterstützung. In der neuen Version SPSS Statistics 29 ist die Integration von Open Source ausgebaut und die Schnittstellen erweitert worden.

Zwei der am häufigsten in der Statistik und Datenanalyse eingesetzten Programmiersprachen sind in SPSS integriert: Python und R. Mittels entsprechenden Schnittstellen in SPSS Statistics können eigene oder von Dritten in R oder Python programmierte Funktionen und Programme direkt in und aus SPSS heraus genutzt werden.

Warum werden R und Python unterstützt?

Die Programmiersprache R ist in den Bereichen Statistik und Data-Mining weit verbreitet und wird oft auch für tiefergehende statistische Analysen verwendet.

R bietet dafür eine Vielzahl an erweiterten statistischen und grafischen Techniken. Mit Hilfe von Paketen kann R einfach mit komplexen Funktionen erweitert werden. Die Programmiersprache R ist als freie Software (Open Source) unter der GNU-Lizenz frei verfügbar und auf den meisten Betriebssystemen (Windows, Linux, macOS, BSD, etc.) vertreten.

Im Gegensatz dazu ist Python eine eher allgemeine, aber hochwertige Programmiersprache mit Schwerpunkt auf Entwicklung von Desktop- und Web-Anwendungen, sowie Webseiten. Python übernimmt hierbei als High-Level-Programmiersprache viele Standardfunktionen. Die einfache Syntax ermöglicht die Codebasis lesbar zu halten und Anwendungen einfacher zu warten.

Beide Sprachen bieten eine hohe Skalierbarkeit, eine hohe Datenverarbeitungsrate und zeigen sich offen gegenüber anderen Programmen. Sie bieten sich daher wegen ihrer Verbreitung und ihrer Vielseitigkeit an.

Integration mit SPSS

Python und R sind in IBM SPSS Statistics bereits integriert. Jeder Nutzer erhält beim ersten Start von SPSS Statistics auf seinem Rechner jeweils eine virtuelle Umgebung mit Compiler, Runtimes und Werkzeuge für R und Python installiert. Diese virtuellen Umgebungen können jederzeit um bestimmte Bibliotheken oder Funktionen erweitert und angepasst werden.

Benutzer können auch separate Versionen der R- oder Python-Laufzeitumgebung extern installieren und SPSS daraufhin so anpassen, dass es diese anstelle der virtuellen Standardumgebung verwendet.

Das SPSS Statistics Integrations Plug-In für R und Python werden automatisch installiert. Die SPSS Befehlssyntax wird durch R und Python Befehle entsprechend erweitert und kann vollständig genutzt werden.

Dieses Plug-in stellt auch einen Zugriff auf die integrierte Entwicklungsumgebung zur Verfügung, mit der Entwicklung, Test und Debugging von R Programmen von SPSS aus vereinfacht werden. Es ist für Windows, Mac OS und SPSS Statistics Server verfügbar.

Bestehende eigene oder von Dritten zur Verfügung gestellte Python- oder R-Programme können sofort nach Installation auf einfache Art und Weise als sogenannte Erweiterungspakete in SPSS eingebunden werden. Einige Erweiterungspakete werden automatisch mit dem Produkt installiert. Viele weitere werden über IBM Predictive Analytics GitHub-Repository angeboten.

Die Erweiterungspakete bieten somit eine Möglichkeit, R- oder Python-Programme/Funktionen zu verteilen und zu nutzen, auch wenn der Nutzer nicht über spezielle R- oder Python-Kenntnisse verfügt.

Einbindung eigener R- oder Python-Programme

Neben der genannten Möglichkeit, R- und Python-Programme als Erweiterungspakete in SPSS einzubinden, kann auch eigener R- oder Python-Code entwickelt und eingebunden werden.

Die Integration mag auf verschiedenen Ebenen erfolgen:

  • Benutzerdefinierte Dialoge mit R- oder Python-eigenen Code-Output
  • Einbindung eigener in R- oder Python-codierte Funktionen
  • Ausführen von R- oder Python-Code direkt aus SPSS Statistics

Es lassen sich so auch die Daten durch die R- oder Python-eigenen Routinen aus SPSS gezielt lesen, steuern und verarbeiten.

Die Interaktion zwischen R oder Python und SPSS Statistics ermöglicht es dem Programmierer, spezifischen Code zu schreiben und diesen mit der üblichen SPSS-Befehlssyntax auszuführen.

SPSS Statistics Preise

SPSS Statistics ist als Dauerlizenz oder als Subscription verfügbar. Die Dauerlizenzen sind modular aufgebaut und können auch als Bundle gekauft werden. Bei den Subscriptions sind die Module immer in Paketen zusammengefasst und können nicht einzeln dazu lizenziert werden. Zusätzlich zur SPSS Statistics Base Subscription gibt es drei weitere Modulpakete als Mietlizenz.

SPSS Bundles

Folgende SPSS Bundles stehen als Dauerlizenzen zur Verfügung:

SPSS Subscriptions

Was enthalten die SPSS Bundles und Subscriptions?

Wir werden sehr häufig gefragt, in welchem Programm welche Funktionen enthalten sind.

Da SPSS modular, also als Baukastensystem, mit Grundprogramm, Zusatzmodulen und verschiedenen Programmpaketen konzipiert ist, ist die Darstellung nicht ganz trivial.

Einen ersten Überblick geben Ihnen vielleicht unsere beiden Tabellen:

Letzte Aktualisierung am 10. September 2022