Statistics und Data Science

Wir betreiben Forschung in den folgenden drei Bereichen und ihren Schnittstellen: psychometrische Modellierung, Machine-Learning Methoden sowie Mehrebenen- und Längsschnittmodellierung. Einerseits untersuchen wir bestehende Verfahren, testen ihre Anwendbarkeit und zeigen Möglichkeiten und Schwierigkeiten für Analysen in der psychologischen Forschung auf. Andererseits entwickeln wir neue Verfahren und erweitern bestehende, um neue Möglichkeiten für die Datenanalyse und Hypothesengenerierung zu bieten. Unserer methodischer Ansatz besteht mehrheitlich aus Simulationsstudien, die in der Open-Source-Software R durchgeführt werden und Ilustrationen der neu- und weiterentwickelten Verfahren anhand empirischer Daten aus der Psychologie.


Ab Februar 2025 werden wir Machine-Learning Modelle untersuchen und erweitern, sodass sie auf hierarchisch strukturierte und longitudinale Daten in der Psychologie angewendet werden können. Dadurch wird es Forschenden in der Psychologie ermöglicht, in hierarchisch strukturierten Daten auch nonlineare Dynamiken psychologischer Prozesse explorativ zu untersuchen. 


Unsere Forschung im Detail

psychometrics

Psychometrische Modellierung

Die psychometrische Modellierung befasst sich mit Herausforderungen von Tests und Messungen von psychologischen Merkmalen. Dabei untersuchen wir Antwortverzerrungen von Instrumenten, die auf Selbstbeurteilung beruhen (z.B. bei der Erhebung der Persönlichkeit). Zudem untersuchen wir Methoden für die differential item und differential step functioning. Diese Phänomene treten auf, wenn bestimmte Items für Befragte mit bestimmten Hintergrundmerkmalen schwieriger sind als für andere.
In unserer Forschungsgruppe untersuchen und entwickeln wir Instrumente, die Forschende dabei unterstützen, die Datenqualität durch die Erweiterung von psychometrischen Modellierungsansätzen oder der Identifikation von relevanten Hintergrundvariablen zu verbessern (z.B. mithilfe von Machine Learning Methoden).

machine_learning

Machine Learning & Interpretierbares Machine Learning

Machine Learning Modelle, wie Decision Trees oder Random Forests, sind robuste und zugleich potente Methoden zur Erkennung und Interpretation komplexer Dynamiken und nonlinearen Auswirkungen von Prädiktor- auf Zielvariablen. Häufig sind viele Machine Learning Modelle jedoch sogenannte "Black Boxen", bei denen nicht nachvollziehbar ist, wie die Vorhersagen zustande gekommen sind.
In unserer Forschungsgruppe evaluieren wir die Anwendbarkeit von Machine Learning Modellen und den Interpretationsverfahren in der psychologischen Forschung. Wir testen die Reaktion auf typische Datenstrukturen in der Psychologie, wie beispielsweise korrelierte Prädiktorvariablen oder Daten mit einer hierarchischen Struktur. Ausserdem erweitern wir Machine Learning Methoden, zum Beispiels durch Tools aus der Psychometrie, um die Interpretation zu verbessern.

multilevel

Multilevel und Longitudinale Modellierung

Häufig sind Daten in der Psychologie hierarchisch strukturiert, beispielsweise wenn Studierende in Klassen oder mehrere Messungen in Personen geclustert sind. Mehrebenen- oder Multilevelmodelle haben sich zu einem wichtigen statistischen Verfahren entwickelt, um Menschen in deren Kontexten zu untersuchen aber auch um intra- und interindividuelle psychologische Prozesse zu unterscheiden.
In unserer Forschungsgruppe erweitern wir die Toolbox für die Analyse von Multilevel-Daten. Wir untersuchen, wie Machine Learning Modelle als reliables Verfahren zur Analyse von mehrebenen und longitudinalen Daten eingesetzt werden können. Ausserdem entwickeln wir neue psychometrische Ansätze, die bei der Bewertung von Datenqualitätsproblemen in intensiven Längsschnittuntersuchungen helfen.