E-HEALTH-COM ist das unabhängige Fachmagazin für Gesundheitstelematik, vernetzte Medizintechnik , Telemedizin und Health-IT für Deutschland, Österreich und die Schweiz.
Mehr

Für das ePaper anmelden

Geben Sie Ihren Benutzernamen und Ihr Passwort ein, um sich an der Website anzumelden

Anmelden

Passwort vergessen?

Forschung |

» Datensätze sind wie Silberbesteck «

Die neue Bundesregierung will in Sachen Forschungsinfrastrukturen eine Verstetigung erreichen, und den Gesundheitsdateninfrastrukturen kommt dabei eine Schlüsselrolle zu. Prof. Dr. Iris Pigeot ist im Rahmen der Nationalen Forschungsdateninfrastuktur (NFDI) Sprecherin des Gesundheitsdatenkonsortiums NFDI4Health. Sie wünscht sich eine Art Masterplan, damit die vielen Infrastrukturaktivitäten bei den Gesundheitsdaten kompatibel werden – auch mit Blick auf den EHDS.

Prof. Dr. Iris Pigeot, Wissenschaftliche Direktorin des Leibniz-Instituts für Präventionsforschung und Epidemiologie – BIPS und Leiterin der BIPS-Abteilung Forschungsdateninfrastrukturen und Data Science; Foto: © Sebastian Budde / BIPS

Lassen Sie uns mit einer kleinen Vorstellungsrunde starten: Was ist und was macht das Leibniz-Institut für Präventionsforschung, das BIPS?
Die Abkürzung BIPS kommt noch aus den Urzeiten des Instituts, als es noch Bremer Institut für Präventionsforschung und Sozialmedizin hieß. Das BIPS ist ein epidemiologisches Forschungsinstitut mit einem Fokus auf nicht übertragbare, chronische Erkrankungen. Wir versuchen, die Ursachen dieser Erkrankungen zu erkennen, nutzen diese Erkenntnisse aber auch, um Präventionsmaßnahmen zu entwickeln, zu implementieren und zu evaluieren. Diese Art Forschung erfordert methodische Expertise in der Epidemiologie und der Biometrie, und sie basiert stark auf Forschungsdateninfrastrukturen.

Das ist unser Stichwort. Sie selbst sind eine der zwei ­Sprecherinnen von NFDI4Health, jenem Konsortium innerhalb der NFDI, das auf personenbezogene Gesundheitsdaten und Public-Health-Daten fokussiert. Was genau ist die ­NFDI? Und warum ist das BIPS beim NFDI4Health-Konsortium in eine führende Rolle gekommen?
Das Ganze geht zurück auf den Rat für Informationsinfrastrukturen (RFII), der im Jahr 2016 eine Forschungsdateninfrastruktur für Deutschland empfohlen hatte. Bund und Länder haben sich dann zusammengesetzt, und 2018 fiel die Entscheidung zur Finanzierung. Damals hatte man sich auch überlegt, zunächst domänenspezifische Konsortien zu fördern. Im Jahr 2020, mitten in der Pandemie, startete dann die fünfjährige Förderperiode für die Konsortien, die in der ersten von drei Ausschreibungsrunden positiv begutachtet wurden. Im selben Jahr wurde die NFDI als gemeinnütziger Verein aufgesetzt.

 

Insgesamt gibt es 26 Konsortien in vier Domänen, plus ein zentrales Konsortium für Basisdienste. NFDI4Health ist eines von acht Konsortien der Domäne Lebenswissenschaften. Wir hatten die Sorge, dass durch die NFDI Infrastrukturen und Regeln entstehen, die aufgrund der hohen Datenschutzrestriktionen nicht anwendbar sind für personenbezogene Gesundheitsdaten. Deswegen haben wir uns als BIPS stark eingebracht. Am BIPS haben wir schon früh ein zentrales Forschungsdatenmanagement aufgesetzt und beschäftigen zum Beispiel seit Langem Data Stewards, schon zu einem Zeitpunkt, als der Begriff noch gar nicht existierte. Diese Arbeit wird bei uns von Dokumentar:innen ausgeübt. Durch das zentralisierte Forschungsdatenmanagement bleiben am BIPS die Forschungsdaten nicht bei den Forschenden, sondern sie gehen direkt in das Forschungsdatenmanagement. Dort werden sie aufbereitet, zentral abgelegt und dann gezielt für bestimmte Gruppen zugänglich gemacht. Die Erwartung war, dass uns NFDI4Health helfen würde, unser Forschungsdatenmanagement innovativer zu gestalten und die Datensätze verstärkt für Dritte zu öffnen.

Wer engagiert sich noch in der NFDI4Health, und wie läuft die Finanzierung genau?
Das NFDI4Health-Konsortium setzt sich aus 17 Partnern zusammen. Das sind einerseits datenhaltende Einrichtungen, andererseits Einrichtungen mit viel Expertise in Bereichen wie Standards und Metadatenschemata, und dann auch Institutionen, die in den Communitys gut verankert sind. Datenhaltende Einrichtungen sind außer dem BIPS zum Beispiel das DIfE, also das Deutsche Institut für Ernährungsforschung in Potsdam, das Robert Koch-Institut, das Max Delbrück Center, die Universitätsmedizin Greifswald und die klinischen Krebsregister. Die ZB MED hat derzeit die Koordination inne. Das Berlin Institute of Health und das HITS kümmern sich um das Metadatenschema und die TMF ist zentral für die Dissemination unserer Services, um nur einige zu nennen. 


Finanziert wird die NFDI zu 90 Prozent vom Bund, zu 10 Prozent von den Ländern. Der ursprüngliche Plan war, dass für den Zeitraum von 2019 bis 2028 bis zu 90 Millionen Euro jährlich zur Verfügung stehen, für alle Konsortien und die Geschäftsstelle zusammen wohlgemerkt. Das NFDI4Health-Konsortium hat in den ersten fünf Jahren rund 15 Millionen Euro bekommen. Die Bewirtschaftung der Mittel liegt bei der Deutschen Forschungsgemeinschaft. Die Gelder kommen aber nicht aus dem regulären DFG-Haushalt. Damit gelten auch die üblichen DFG-Regeln für die Mittelvergabe nur bis zu einem gewissen Grad. Ab Herbst 2025 gehen wir mit allen Konsortien der ersten Ausschreibungsrunde in die zweite Förderperiode der NFDI, d. h. auch NFDI4Health wird verlängert. Allerdings sind die Mittel jetzt um rund 30 Prozent gekürzt worden, und die zweite Förderphase wurde von fünf auf drei Jahre verkürzt. Das ist schon ein harter Einschnitt.

Können Sie etwas über die konkreten Use Cases der NFDI4Health Infrastruktur sagen? Was haben Sie in der ersten Förderphase erreicht?
Wir haben uns bisher im Wesentlichen damit befasst, die datenhaltenden Einrichtungen zu befähigen, ihre Daten zu FAIRifizieren und aufzubereiten, mit sehr vielen Tools, die wir zur Verfügung stellen. Zwei beispielhafte Use Cases sind Ernährungsepidemiologie und Epidemiologie chronischer Erkrankungen, für die Datenbestände mithilfe von in der NFDI4Health entwickelten Algorithmen harmonisiert und Metadatenschemata implementiert wurden. Wir haben daran gearbeitet, dass die datenhaltenden Einrichtungen eine Software implementieren können, die eine föderierte Datenanalyse ­ermöglicht, d. h. die Datenkörper verbleiben bei den datenhaltenden Einrichtungen. Für die föderierte Analyse werden dann Algorithmen zu den Projektpartnern verschickt, und nicht die Daten selbst. Zudem haben wir uns mit dem Thema Record Linkage beschäftigt und ein White­paper verfasst, an dem wir mit allen wichtigen Akteuren der deutschen Gesundheitsforschung zusammengearbeitet haben.

 

Eines der großen Hindernisse in Deutschland ist, dass wir es im Gesundheitswesen bis heute nicht geschafft haben, einen Unique Identifier zu etablieren, über den Daten, die an unterschiedlichen Stellen zu derselben Person gehalten werden, verknüpft werden könnten. Das geht nur mit einem Riesenaufwand. In dem gemeinsamen Whitepaper haben wir auch viele Use Cases aufgelistet, bei denen man derzeit mit großen Schwierigkeiten zu kämpfen hat oder sogar komplett scheitert.

Stichwort andere Gesundheitsdateninfrastrukturen. Es gibt in Deutschland das Netzwerk Universitätsmedizin, das eine eigene klinische Studienplattform hat. Es gibt die Medizininformatik-Initiative mit ihrer Infrastruktur. Es gibt das Forschungsdatenzentrum (FDZ) am BfArM, das Abrechnungsdaten und künftig auch Daten aus klinischen Krebsregistern und den elektronischen Patientenakten zugänglich machen soll. Wie verhält sich das alles zueinander? Letztlich geht es ja allen um personenbezogene Gesundheitsdaten.

Ich glaube, die verschiedenen Initiativen entstehen einfach durch die verschiedenen Arten der Datenkörper, die man nicht einfach über einen Kamm scheren kann. Die MII zum Beispiel fokussiert stark auf Versorgungsdaten der Krankenhäuser. Dem NUM geht es um Forschungsdaten aus der Universitätsmedizin. NFDI4Health ist im Bereich Epidemiologie und Public Health angesiedelt. Uns interessieren nicht nur rein medizinische Informationen. Diese Infrastrukturen haben schon alle ihre eigene Berechtigung. Aber klar, wir müssen das kompatibel machen. Parallelentwicklungen können wir uns weder finanziell noch wissenschaftlich leisten. Deswegen müssen die Infrastrukturen kooperieren.

Das Whitepaper zu Record Linkage war so ein Gemeinschaftsprojekt. Wo gibt es noch Kooperationen?
Es wurde eine Koordinierungsgruppe der Gesundheitsforschungsdateninfrastrukturen (GFDI) etabliert, die sich jetzt regelmäßig trifft, in der ist zum Beispiel auch die NAKO Gesundheitsstudie vertreten. In der anstehenden Förderperiode wollen wir dafür sorgen, dass die verschiedenen Datenkörper alle über ein Portal erreichbar sind, nämlich über das Forschungsdatenportal Gesundheit, das von der MII aufgebaut wurde. Wenn uns das gelingt, wäre das eine tolle Sache. Dadurch erzeugen wir auch echte Synergien, und wir ermöglichen es den Forschenden, über eine Art One-Stop-Shop den Zugriff auf alle wichtigen Datenkörper beantragen zu können. Wie wir das alles dann mit dem European Health Data Space (EHDS) vereinbaren können, müssen wir allerdings noch sehen. Das ist noch mal eine separate Diskussion.

Durch den EHDS entsteht ja quasi von außen Druck, die Gesundheitsdateninfrastrukturen in Deutschland kompatibel zu machen. Die Politik hält sich da bedeckt, aber man hat den Eindruck, als ob zumindest das Bundesgesundheitsministerium das BfArM zu einer zentralen Anlaufstelle machen möchte. Ist das zielführend?
Im Moment habe ich oft das Gefühl, dass wir ständig links oder rechts von politischen Entscheidungen überholt werden, wenn wir gerade etwas etabliert haben. Auch bei der FDZ-Infrastruktur am BfArM reden wir ja von einem sehr speziellen Datenkörper, in erster Linie den Abrechnungsdaten. Hilfreich ist, dass die Daten des FDZ gemäß Gesundheitsdatennutzungsgesetz mit den Krebsregisterdaten verknüpft werden können. Darüber hinaus bauen die Krebsregister an einem eigenen Zugangsportal. D. h., ja, es gibt im Moment schon ein paar Doppelstrukturen, aber das wird sich in den nächsten Jahren zurechtruckeln.

Kommen wir noch mal kurz auf das Thema Record Linkage zurück, weil das ja eines der Kernthemen ist, wenn es darum geht, die unterschiedlichen Gesundheitsdateninfrastrukturen kompatibel zu machen. Es gibt nicht nur Ihr Whitepaper, es gibt auch ein zeitgleich entstandenes Gutachten, das das Gundesgesundheitsministerium in Auftrag gegeben hat und das auf Record Linkage im Kontext FDZ fokussiert. Haben Sie denn in Ihrem Whitepaper auch konkrete Lösungsvorschläge für die Politik gemacht?
Die Kernbotschaft an die Politik ist: Wir brauchen in irgendeiner Art und Weise einen Unique Identifier, wie auch immer er am Ende aussieht. Es gibt dafür Role Models in Europa, wir sind nicht die Ersten, die so etwas etablieren würden. Diese verschiedenen europäischen Ansätze sollte man sich genau ansehen und dann etwas Analoges in Deutschland aufbauen. Das muss keine Eins-zu-eins-Kopie von zum Beispiel Dänemark sein, aber in­spirieren lassen sollten wir uns da schon.

 

Als Epidemiologin hätte ich irgendwann gern die Möglichkeit, über einen Unique Identifier bei der Untersuchung der Entstehung einer bestimmten Krankheit verschiedene Datenquellen einer Person zusammenzuführen und sie zu analysieren – klinische Daten, Ernährung, Umweltdaten und anderes. Die Dänen können das schon und können somit auf manche Fragen Antworten in Sekundenschnelle geben, die wir in Deutschland nicht ansatzweise beantworten könnten. Das ist schon bitter, und in der Pandemie ist uns das ja auch kräftig auf die Füße gefallen.

 

Der Unique Identifier allein reicht natürlich nicht. Es braucht so etwas wie ein Third-Party Trust-Center, also eine externe Vertrauensstelle, die auf Antrag der Forschenden verknüpfte Analysedatensätze zur Verfügung stellt. Was nicht geht, ist, dass alle Daten öffentlich zur Verfügung stehen, und wir verknüpfen diese dann einfach, wie wir gerade lustig sind. Das will auch keiner.

Letztlich stehen ja die forschungsbezogenen Gesundheitsdateninfrastrukturen, vielleicht mit Ausnahme der FDZ-Infrastruktur, alle vor derselben Frage: Wie gelingt es, aus der bisherigen Projektförderung rauszukommen und die Infrastrukturen zu verstetigen – so ähnlich wie das auf 
Versorgungsseite durch die Etablierung der gematik gelungen ist. Was ist Ihre Antwort?

Also zumindest steht im Koalitionsvertrag, dass die NFDI verstetigt werden soll. Der Wissenschaftsrat hat Mitte Juli seine Empfehlungen zur Strukturevaluation der NFDI publiziert. Er schlägt vor, die Konsortien am Ende der zweiten Förderphase neu zusammenzuführen zu größeren Fachbereichen und eine zentrale Finanzierung zu etablieren, die nicht mehr projektbezogen ist. Die NFDI als Verein könnte im Prinzip Gelder bekommen und könnte die dann an die darunterliegenden Strukturen weitergeben.

 

Dies ist aber nur ein Vorschlag. Wir werden uns in der nächsten Phase geeignete Business-Modelle überlegen. Eine Möglichkeit ist dabei, die Zurverfügungstellung von Daten kostenpflichtig zu verankern, ähnlich wie es derzeit schon am FDZ umgesetzt wird. Daran könnte man sich orientieren. Es gibt manchmal so eine Erwartungshaltung, dass der Zugriff auf Daten, die mit öffentlichen Mitteln generiert wurden, umsonst sein sollte. Aber das ist naiv, denn diese Datensätze müssen kontinuierlich gepflegt werden, um nützlich zu bleiben. Das ist so wie bei einem Silberbesteck, das muss auch immer wieder poliert werden.

 

Was ich ganz interessant fand: Es gab eine europäische Umfrage zu den Kosten, die möglicherweise im Zusammenhang mit dem EHDS auftreten. Das Land, das die höchsten Kosten angesetzt hat, war Dänemark, also genau das Land, das auch die meisten Erfahrungen damit hat. Die wissen, wovon sie reden.

Sie haben jetzt über die Verstetigung der NFDI geredet, aber es geht ja um mehr. Wenn Sie anfangen, mit MII und NUM gemeinsam das Forschungsdatenportal Gesundheit zu bespielen und das verstetigt werden soll, dann wird es dafür gemeinsame Strukturen brauchen. Auch Unique Identifiers verwalten oder Trust-Center-Funktionen für Record-Linkage-Szenarien übernehmen kann nicht eine Infrastruktur allein. Was könnte man sich da vorstellen?

Ich glaube schon, dass es irgendeine Art von übergeordneter Struktur braucht. Die NFDI könnte man in diese Richtung ausbauen, aber das muss dann auch finanziert werden. Man könnte sich auch eine Struktur vorstellen, die von NFDI, MII und NUM gemeinsam getragen wird. Wir müssen dabei natürlich immer den EHDS im Blick behalten, der uns eine weitere Struktur, einen Central Health Data Access Body, „aufzwingt“, und dazu optional dezentrale Health Data Access Bodies. Das muss schon alles mitgedacht werden.

 

Aus dieser etwas größeren Perspektive ist die Rolle von NFDI, NUM und MII aus meiner Sicht zunächst einmal, dafür zu sorgen, dass die Daten aus den unterschiedlichen Domänen eine Qualität haben, die sie für den EHDS tauglich macht. Die NFDI hat hier insofern noch mal eine Sonderstellung, als sie bedingt durch die verschiedenen Domänen nicht nur mit Gesundheitsdaten operiert.

Haben Sie insgesamt den Eindruck, dass die Gesundheitsdatenforschung in Deutschland mit Blick auf den EHDS adäquat wegkommt? Die Vorgängerregierung hatte ja zum Beispiel geplant, die gematik zur deutschen Digital Health Authority für den EHDS zu machen – eine Art Aufsichtsfunktion. Ist das zu versorgungslastig gedacht?

Man muss schon aufpassen, dass man nicht nur in Richtung Versorgungsforschung denkt. Allerdings wird der EHDS anfangs in diese Richtung gehen, einfach weil die Daten am Anfang primär aus der Versorgung kommen werden. Und der EHDS zielt ja nicht nur auf die Forschung, sondern explizit auch auf Datenbereitstellung in der Versorgung. Aber klar: Perspektivisch sollten die relevanten Forschungsdaten auch Teil des EHDS werden, zumal deren Datenqualität oft viel höher ist, denken Sie an Kohorten wie die NAKO oder SHIP.

Das wird nicht einfach, weil wir dann von Datensätzen mit unterschiedlichen Konsens-Modellen reden, den Opt-out-Datensätzen aus der Versorgung und den Informed-Consent-Datensätzen, die für die Forschung generiert werden.
Genau, das ist dann noch mal ein richtig dickes Brett, das wir bohren müssen. Klar ist, dass man mit Informed Consent erhobene Daten nicht einfach beliebig verteilen kann. Und ein pauschaler Opt-out ist auch keine Lösung. Ich denke schon, dass es Menschen geben wird, die ihre Daten zum Beispiel in Deutschland für epidemiologische Kohorten zur Verfügung stellen würden, die aber nicht wollen, dass sie automatisch auch im EHDS zugänglich sind. Ich fände es übrigens auch nicht gut, wenn eine Bundesoberbehörde die zentrale Aufsicht über den EHDS übernimmt – nicht, weil ich aktuell jemandem misstrauen würde, sondern weil wir nicht wissen können, wie sich unsere politische Situation in Zukunft entwickelt. Eine unabhängige Instanz wäre sinnvoll, denn der Datenschatz, der da entstehen wird, der ist gewaltig.

Ihre abschließenden Empfehlungen an die ja noch junge neue Bundesregierung?

Erstens: Wir haben in unterschiedlichen Domänen Gesundheitsdateninfrastrukturen geschaffen, und die sollten wir jetzt auch nutzen. Wir sollten nicht noch weitere parallele Infrastrukturen aufbauen.

 

Zweitens: Die finanziellen Ressourcen dieser Infrastrukturen dürfen nicht so drastisch gekürzt werden, wie es jetzt passiert ist. Gerade wenn wir jetzt diskutieren, ob eine NFDI nicht vielleicht einige Datenkörper aus den USA übernehmen könnte, dann passt das mit Mittelkürzungen einfach nicht zusammen. Daten müssen weiterentwickelt, weiterverarbeitet, gereinigt und gepflegt werden. Das ist kein Stück Holz, das man irgendwo in den Schrank legt.

 

Drittens: Wir müssen die Leute, die in Deutschland etwas von Gesundheitsdateninfrastrukturen verstehen, an einen Tisch bringen und eine übergeordnete Struktur schaffen. Wie die heißt, ist völlig egal, sie muss nur funktionieren und es müssen dafür ­ausreichende Mittel zur Verfügung gestellt werden. Wenn Daten wirklich das neue Öl sind, dann brauchen wir auch die Raffinerien, die Tanks und die ganze Infrastruktur drum herum. 



Das Interview führte Philipp Grätzel von Grätz, Chefredakteur E-HEALTH-COM.

 

ZUR PERSON

Prof. Dr. Iris Pigeot
ist Wissenschaftliche Direktorin des Leibniz-Instituts für Präventionsforschung und Epidemiologie – BIPS und dort auch Leiterin der Abteilung Forschungsdateninfrastrukturen und Data Science. Sie ist eine von zwei Sprecherinnen des NFDI4Health-Konsortiums, das sich unter dem Dach der Nationalen Forschungsdateninfrastruktur (NFDI) um personenbezogene Gesundheitsdaten kümmert. Iris Pigeot war auch Mitglied im Expert:innenrat „Gesundheit und Resilienz“ der Bundesregierung.