Eduardo ist Nachwuchswissenschaftler am GIGA Hamburg und Mitglied des Graduiertenzentrums „Effective and Innovative Policymaking in Contested Contexts“ (EIPCC) an der Willy Brandt School of Public Policy. Er und sein Co-Autor, Levente Littvay von der Ungarischen Akademie der Wissenschaften, wurden auf der ersten MethodsNET-Konferenz für ihre Arbeit zur Nutzung von KI für die Datenerhebung ausgezeichnet.
In ihrem Beitrag wird Chrono-sampling vorgestellt, ein neuartiges generatives KI-Framework, das als sozialwissenschaftliche Zeitmaschine fungiert und es Forschern ermöglicht, historische öffentliche Meinungsdaten durch die Simulation von Umfrageteilnehmern aus der Vergangenheit zu gewinnen. Anstatt nur oberflächliche Verteilungen zu imitieren, ermöglicht Chrono-sampling Large Language Models (LLMs), kontextabhängige Beziehungen nachzubilden - wie sich Einstellungen über wirtschaftliche Rezessionen, politische Übergänge und soziopolitische Klimata hinweg verändern:
- Zeitliche Eingrenzung, die das Wissen des Modells auf ein bestimmtes Jahr in der Geschichte einschränkt
- Clio Personas, reichhaltig konstruierte biografische Aufforderungen auf der Grundlage realer menschlicher Profile, die das Modell dazu bringen, sich wie ein historisch verankertes Individuum zu verhalten.
Anhand von Daten aus der Reagan- (1980er Jahre), Bush- (2000er Jahre) und Obama- (2010er Jahre) Ära zeigt die Studie, dass LLMs zeitliche Verschiebungen in wichtigen Beziehungen genau reproduzieren können - beispielsweise, wie retrospektive und prospektive wirtschaftliche Bewertungen während Rezessionen und Aufschwüngen oder unter verschiedenen Parteiregimes unterschiedlich korrelieren. Diese reproduzierten Muster stimmen mit realen menschlichen Daten überein und bleiben auch bei Robustheitsprüfungen mit mehreren Large Language Models und Prompt-Varianten erhalten. Im Gegensatz zu früheren Ansätzen, die nur starke oder statische Assoziationen bewahrten, erfasst Chrono-sampling, wie sich die Muster mit dem Kontext entwickeln.
Durch den Nachweis, dass LLMs nicht nur Verteilungen, sondern auch zeitlich bedingte kausale Strukturen modellieren können, bietet Chrono-sampling ein leistungsfähiges Instrument zur Erweiterung von Zeitreihen, zur Simulation kontrafaktischer Ereignisse und zur Untersuchung historischer öffentlicher Meinungen, für die keine Daten existieren. Dies eröffnet neue Möglichkeiten für die computergestützte Sozialwissenschaft - insbesondere in Zeiträumen, in denen eine herkömmliche Datenerhebung unmöglich war.