Wofür eignet sich die Forschung mit Routinedaten besonders gut?
Solche Daten sind immer dann besonders stark, wenn es um ganze Gruppen von Menschen geht. Beispiel MS, ein aktuelles Thema bei uns im Rahmen eines Innovationsfondsprojekts. Wie sind diese Patientinnen und Patienten versorgt? Wie viele lassen sich impfen und gibt es da Unterschiede hinsichtlich Wirksamkeit und Verträglichkeit? Anderes Beispiel: Palliativversorgung. Wie viele Menschen in ihrem letzten Lebensjahr bekommen Palliativversorgung? Beginnt die früh oder erst ganz kurz vor dem Tod? Das sind typische Fragen. Spannend ist außerdem, Versorgungsdaten mit anderen Datenquellen zu verknüpfen. Auch dazu ein Beispiel: Wir untersuchen derzeit zusammen mit der Allgemeinmedizin am Universitätsklinikum Köln die Rolle von Hitzewellen in der Arzneimitteltherapie. Dazu verknüpfen wir Abrechnungsdaten der Krankenkassen für die Stadt Köln mit Daten des Deutschen Wetterdienstes. So können wir uns bei Menschen, die hitzesensitive Medikamente nehmen, ansehen, was genau zum Beispiel während einer Hitzewelle im Sommer mit tropischen Nächten passiert oder nicht passiert ist.
Sie forschen vor allem mit Abrechnungsdaten von Krankenkassen. Wo sind die Grenzen dieser Art von Daten?
Routinedaten der GKV werden dann schwächer, wenn es darum geht, in konkrete medizinische Fragen einzusteigen. Wenn ich eigentlich Laborwerte oder Blutdruckwerte brauche, um etwas zu verstehen, komme ich an Grenzen. Hier sind wir dann auf die Verknüpfung mit anderen Datenquellen angewiesen, sofern das möglich ist.
Welche Arten von Datenquellen nutzen Sie in Ihrer Forschung besonders gerne oder weniger gerne, und warum?
Ich würde das weniger an der Datenquelle an sich festmachen, sondern daran, wie ich die Daten nutzen kann und wie gut der Weg der Daten zu mir dokumentiert ist. Bei GKV-Routinedaten weiß ich: Hier gucke ich auf Versicherte der Krankenkasse XY in dem und dem Zeitraum. Wenn ich Daten aus einem Ärztepanel habe, die ich irgendwo kaufe, dann muss ich gucken: Wie setzt sich das Panel zusammen? Wie werden die Daten erhoben? Das ist wichtig, um gegebenenfalls einen Bias berücksichtigen zu können.
Stichwort Verknüpfung von Datensätzen. Hier soll das neue Forschungsdatenzentrum, das FDZ, am BfArM helfen. Es soll nicht nur unterschiedliche Quellen für Abrechnungsdaten zusammenbringen, sondern diese auch (geplant) Mitte 2025 mit freiwillig gespendeten Daten aus den neuen elektronischen Patientenakten verknüpfen, außerdem auch mit Daten aus den klinischen Krebsregistern und perspektivisch noch weiteren Registern. Ist das der richtige Weg?
Auf jeden Fall richtig. Das ist ja auch eine Lektion aus der Pandemie, und es ist wirklich überfällig, ein wichtiger Schritt nach vorn, wenn es dann startet. Bisher arbeiten wir überwiegend mit Daten einzelner Krankenkassen. Durch das FDZ können wir auf die Daten von viel mehr Menschen gucken. Dadurch werden gerade bei selteneren Erkrankungen Auswertungen möglich, die bisher nicht möglich waren.
Es gab ja auch bisher schon ein deutlich weniger umfassendes FDZ am BfArM bzw. vorher am DIMDI. Konnten Sie damit Erfahrungen sammeln? Wenn ja, welche?
Wir haben damit ein bisschen gearbeitet, ja. Es gab aber immer praktische Schwierigkeiten, vor allem dauerte es alles sehr lang. Wir erhoffen uns natürlich, dass das mit dem neuen FDZ jetzt anders wird – und sind da auch optimistisch.
Was bringt konkret die im FDZ künftig mögliche Ergänzung der Abrechnungsdaten durch die ePA-Daten?
Ich hatte das ja schon kurz erwähnt: Abrechnungsdaten fehlt die medizinische Tiefe. Wenn ich in die Krankheitsschwere oder auch in individuelle Verläufe von Erkrankungen einsteigen will, dann brauche ich häufig zusätzliche Informationen. Die ePA ist hier eine mögliche Datenquelle, die solche Informationen liefern kann. Auch für Dinge, die wir im weitesten Sinne als Patient-Reported Outcomes bezeichnen, kann die ePA eine Quelle werden. Die Einschränkung ergibt sich aus der Freiwilligkeit. Versicherte können dem Datentransfer aus der ePA ins FDZ widersprechen. Da stellt sich natürlich die Frage: Wie viel Opt-out wird es geben? Und was ist die Systematik hinter denen, die sagen, sie wollen das nicht? Da sind wir in der Community alle so ein bisschen gespannt. Wenn bestimmte Gruppen systematisch sagen würden, dass sie keine ePA-Forschung wollen, dann würden wir diese Gruppen für die Forschung verlieren. Spannend ist natürlich auch die Verknüpfung hin zu den Krebsregistern, die aus medizinischen Einrichtungen gefüllt werden und wo es durch die Meldepflicht aufseiten der Einrichtungen in jedem Fall einen sehr breiten Datensatz gibt. Da können wir uns dann zum Beispiel Krankheitsverläufe oder Therapieverläufe ansehen und die in Verbindung bringen mit der individuellen Krankheitsgeschichte, mit Komorbiditäten oder auch zum Beispiel mit dem Wohnort.
Wo sind aus Ihrer Sicht die Grenzen der Forschung per FDZ? Für welche Arten von Fragestellungen sind andere Quellen – insbesondere Daten aus Krankenhäusern oder aus Praxisinformationssystemen – besser geeignet?
Ich glaube schon, dass wir mit dem, was im Moment beim FDZ geplant ist, ziemlich weit kommen. Das Konzept ist schon ein Meilenstein verglichen mit dem, was bis jetzt möglich war. Aber ich gucke natürlich durch die Brille der Versorgungsforschung. Es gibt ja noch deutlich mehr Nutzungsszenarien für Routinedaten. Ich bin sicher, dass im Rahmen der klinischen Forschung sehr viel mehr Wert auf primäre Behandlungsdaten gelegt wird, also auf Daten, wie sie in Klinikinformationssystemen oder Praxis-IT-Systemen anfallen. Die individuelle Behandlung durch Ärztinnen und Ärzte systematisch analysieren – das wird auch ein künftiges FDZ nur begrenzt leisten können. Ein anderer Bereich ist die KI-Entwicklung. Wenn es darum geht, auf individueller Ebene bestimmte Ereignisse zu prädizieren, dann braucht es die Reichhaltigkeit klinischer Daten. Denn sonst scheitere ich an Sachen wie Schweregrad, genauem klinischem Verlauf, genauem Therapieverlauf. Die Modelle laufen dann Gefahr, zu unscharf und entsprechend nicht nützlich genug zu werden.
Gibt es andere Möglichkeiten, stärker in die Tiefe zu gehen, wenn ein Datensatz die nötige Tiefe nicht hergibt?
Es gibt andere Möglichkeiten, ja. Was wir in Köln zunehmend gerne machen, ist, dass wir aktiv Daten erheben, die die Routinedaten ergänzen, zum Beispiel indem wir Versicherte befragen zu Aspekten der Patient Experience. Das hilft uns, den Kontext unserer Daten und Ergebnisse besser zu verstehen. Es gibt aber auch Fragestellungen, die wir ohne Zugriff auf Primärdaten nicht beantworten können. Wenn so etwas an uns herangetragen wird, dann müssen wir das ablehnen.
Auch in Deutschland entsteht langsam eine Art Markt für anonymisierte und pseudonymisierte Patientendatensätze. Wie beurteilen Sie diesen Trend, der in anderen Ländern ja teils schon viel weiter fortgeschritten ist?
Es ist grundsätzlich richtig, dass wir Daten stärker nutzen, um das Gesundheitswesen besser zu machen. Und dabei geht es nicht nur um die Versorgungsforschung im engeren Sinne. Was die Vielfalt angeht, sehe ich das sehr pragmatisch und grundsätzlich positiv, sofern gewährleistet ist, dass die datenschutzrechtlichen Regularien eingehalten werden. Ich denke auch, dass eine Vielfalt von Ansätzen hier größere Chancen hat, als alles auf eine monolithische Struktur zu konzentrieren. Das FDZ aufzusetzen, ist eine offensichtliche Mammutaufgabe. Da mehrgleisig zu fahren, andere Wege zuzulassen, immer mit leicht unterschiedlichen Schwerpunkten, mit teilweise größerer Nähe zur klinischen Versorgung, das halte ich schon für sinnvoll und zielführend.