Provenienz und Verbreitungspfade von Desinformationen mit KI-gestützter Evidenzprüfung
Laufzeit: April 2026 – März 2029
Förderung: BMFTR · Programm „Vertrauen in Demokratie und Staat: Digitale Desinformation erkennen und abwehren“ · Fkz 16KIS2511K
Konsortium: Institut für Angewandte Informatik (InfAI) e.V., Leipzig (Verbundkoordination); ConPolicy GmbH, Berlin; Europäisches Zentrum für Presse- und Medienfreiheit SCE mbH, Leipzig
Leitung am ECPMF: Dr. Patrick Peltz
Unabhängige Berichterstattung ist eine strukturelle Voraussetzung demokratischer Öffentlichkeit. Desinformation untergräbt sie systematisch: nicht nur durch erfundene Inhalte, sondern durch Auslassung, Kontextmanipulation und koordinierte Narrativkampagnen, die mit herkömmlichen redaktionellen Mitteln schwer zu erkennen sein können. Erschwerend kommt hinzu, dass KI-Systeme, die zur Inhaltsbewertung eingesetzt werden, zur Halluzination neigen. Ohne eine gesicherte, überprüfbare Faktenbasis können automatisierte Wahrscheinlichkeitsaussagen über Desinformationsgehalt ihrerseits Fehler erzeugen.
„PROVAIDE“ ist ein dreijähriges Forschungs- und Entwicklungsprojekt, das zum Ziel hat, diese Lücke zu untersuchen und zu schließen. Bis Ende 2029 soll ein Recherche-Tool entstehen, das Journalist:innen dabei unterstützt einzuschätzen, woher eine Information stammt, wie sie sich verbreitet hat und wie wahrscheinlich es ist, dass sie Teil einer koordinierten Desinformationskampagne ist. Ob und wie gut das technisch, methodisch und in der Praxis realisierbar ist, ist eine der zentralen Fragen, denen das Projekt nachgeht.
Ziele und Ansatz
Das angestrebte Tool soll Journalist:innen ermöglichen, die Herkunft einer Information nachzuverfolgen, ihre Verbreitungswege zu kartieren und einzuschätzen, ob sie Teil einer koordinierten Desinformationskampagne ist. Es analysiert Ursprung, Verbreitungskanäle und typische Muster von Informationen und bewertet deren Glaubwürdigkeit. Die multimodale Auswertung von Text, Bild, Video und Audio soll eine besonders fundierte Einschätzung ermöglichen. Ob und wie gut diese Funktionen technisch und in der redaktionellen Praxis umsetzbar sind, untersucht das Projekt durch iterative Entwicklung und systematische Nutzerforschung.
Eine zentrale Herausforderung ist dabei die Halluzinationsneigung großer Sprachmodelle: Sie erzeugen plausibel klingende Ausgaben, die faktisch falsch sein können, besonders für aktuelle Ereignisse. PROVAIDE will dem durch eine kontinuierlich aktualisierte, von Expert:innen annotierte Faktendatenbank begegnen, die als Korrektiv während der KI-Inferenz eingesetzt werden soll.
Datenbasis
Das technische Fundament ist das Wortschatz-Leipzig-Korpus: über 20 Jahre kontinuierliches Newscrawling, mehr als vier Millionen Dokumente pro Jahr. Ergänzt werden soll es durch gezieltes Crawling weiterer Medienquellen sowie Methoden zur Verarbeitung von Audio, Bild und Video.
Nutzerforschung und Interface-Design
Parallel zur technischen Entwicklung untersucht das Projekt, was Journalist:innen tatsächlich brauchen und wie ein solches Tool gestaltet sein muss, um in der redaktionellen Praxis nutzbar zu sein. Dazu werden Journalist:innen systematisch in den Entwicklungsprozess eingebunden, von der Bedarfserhebung bis zur Evaluation des fertigen Demonstrators.
Open-Source-Veröffentlichung
Trainierte Klassifikatoren, annotierte Datensätze und zentrale Softwarekomponenten sollen soweit rechtlich möglich unter Open-Source-Lizenzen bereitgestellt werden. Ziel ist, dass die entwickelten Methoden und Werkzeuge nach Projektende von anderen Forschungsgruppen und Redaktionen weitergenutzt und weiterentwickelt werden können.















