Geben Sie Ihren Benutzernamen und Ihr Passwort ein, um sich an der Website anzumelden
Datenbeschaffung: Ein steiniger Weg wird geebnet
Sobald Forschende wissen, welche Kohorte, also welche Patienten(-daten), zur Beantwortung einer Forschungsfrage benötigt wird, gilt es diese zusammenzustellen. Aber welche Datenquellen können dafür verwendet werden und wie sind diese aufzufinden? Im besten Fall können alle zerstreut verfügbaren Daten entsprechend den Ein- und Ausschlusskriterien der Kohorte einheitlich gesucht und beantragt werden. Die reale Praxis ermöglicht das aktuell jedoch noch nicht, v. a. wenn eine Studie aus mehreren Datenquellen gespeist werden soll. Die Voraussetzungen dafür sollen mit dem Europäischen Gesundheitsdatenraum (EHDS) geschaffen werden.
Versorgungsdaten im Nachhinein für die Forschung zu verwenden ist bisher ohne Einwilligung nicht möglich. In Unikliniken wird deswegen häufig bereits bei der Patientenaufnahme danach gefragt. Nicht involvierte Forschende wissen aber in der Regel nicht, dass diese Daten und die Einwilligung für ihre Nutzung vorhanden sind. Der Nutzendenkreis ist somit sehr eingeschränkt. Die Medizininformatik-Initiative (MII) erschließt die Daten zwar für weitere Nutzende, die verfügbaren Daten und deren Nutzung sind jedoch in der Regel weiter auf Unikliniken beschränkt. Falls die Beantwortung der Forschungsfrage Daten aus weiteren Quellen des Gesundheitssystems benötigt, sind diese gesondert zu beantragen. Dieser Antrag kann künftig bei der, auf Basis des „Gesetz zur verbesserten Nutzung von Gesundheitsdaten“ (GDNG) neu entstandenen, zentralen „nationalen Datenzugangs und -koordinierungsstelle“ (DACO) gestellt werden, damit das Forschungsdatenzentrum Gesundheit (FDZ) des Bundesinstituts für Arzneimittel und Medizinprodukte (BfArM) die angefragten Daten für festgelegte Zwecke verfügbar machen kann. Ähnliches gilt für Daten der zahlreichen Register für gesundheitsbezogene Daten, z. B. der Krebsregister der jeweiligen Bundesländer. Diese werden zwar ab 2026 im Zentrum für Krebsregisterdaten (ZfKD) beim Robert Koch-Institut gebündelt, sollen jedoch dem GDNG zufolge auch mit den Abrechnungsdaten der GKV im FDZ zusammengeführt werden können. Das GDNG ist hierbei als inkrementelles Brückengesetz der EHDS-Verordnung konzipiert und nimmt einige seiner Maßnahmen vorweg. Das gilt insbesondere für einen einheitlichen Datensatzkatalog, der verfügbare Datensätze grob beschreiben soll, und dadurch als zentraler Einstiegspunkt ihrer Auffindbarkeit dient.
Eine wegweisende Verordnung zum EHDS
Die Verordnung über den European Health Data Space (EHDS-VO) schafft einen einheitlichen europäischen Rechtsrahmen für die Nutzung von Gesundheitsdaten. Ein Fokus dabei ist die Sekundär-Datennutzung, also die Verwendung von Gesundheitsdaten zu Forschungs-, Innovations- und Politikgestaltungszwecken. Die Verordnung sieht vor, dass Gesundheitsdaten aus unterschiedlichen Quellen – etwa aus elektronischen Patientenakten, Registern oder Forschungsergebnissen – datenschutzkonform und unter hohen Sicherheitsstandards für berechtigte Akteure zugänglich gemacht werden. Eine Kernmaßnahme der EHDS-VO ist die Einrichtung sogenannter Health Data Access Bodies (HDABs) in den Mitgliedstaaten der EU, die als zentrale Anlaufstellen für Anträge auf Sekundär-Datennutzung fungieren werden (in Deutschland wird die DACO am BfArM damit beauftragt). Diese Stellen prüfen und genehmigen Zugriffe auf Gesundheitsdaten, wobei sie strenge Anforderungen an Datenschutz, Datensicherheit und Zweckbindung sicherstellen. Die Verordnung legt zudem fest, dass personenbezogene Daten für die Sekundärnutzung grundsätzlich nur in pseudonymisierter oder anonymisierter Form bereitgestellt werden dürfen. Die damit verbundenen Maßnahmen inkludieren Vorgaben zur Verwendung eines Standards (HealthDCAT-AP) zur einheitlichen Beschreibung verfügbarer Datensätze in einem Datensatzkatalog und zu sicheren Verarbeitungsumgebungen. Um die Maßnahmen der EHDS-VO zu konkretisieren, werden in der „Second Joint Action Towards the European Health Data Space“ (TEHDAS2) durch die Mitgliedstaaten bis Ende 2026 technische Spezifikationen und Guidelines erstellt, die größtenteils in verbindlichen Durchführungsrechtsakten zur EHDS-VO münden werden. Dabei können alle Interessierten am kontinuierlichen Stakeholderprozess teilnehmen: Get involved – TEHDAS https://tehdas.eu/get-involved/
Als Ergebnis der Konkretisierung in TEHDAS2 und den anschließenden Durchführungsrechtsakten ist ein einheitlicher Rahmen für die Datensatzbeschreibung durch den Datenhalter, für die zentrale Antragstellung und für eine gebündelte Datenbereitstellung über die HDABs der Mitgliedstaaten zu erwarten.

Vom steinigen Weg zum fließenden Zyklus
In der EHDS-VO ist größtenteils nicht festgelegt, wer konkret die zahlreichen Maßnahmen wie durchführen muss. Denn die EHDS-VO bietet in erster Linie einen Rahmen, der noch gefüllt und ggf. national konkretisiert werden muss. Das gilt auch für die Zuweisung konkreter Aufgaben an Rollen und nationalen Akteuren. Die EHDS-VO fordert jedoch nur wenige Rollen der Sekundär-Datennutzung, allen voran Gesundheitsdateninhaber und Zugangsstellen für Gesundheitsdaten und Gesundheitsdatennutzer. Aber erst die Betrachtung eines vollständigen Datenzyklus ermöglicht die Zuweisung aller Verantwortlichkeiten an konkrete Rollen und zeigt dabei mögliche Lücken auf. Um das zu verdeutlichen, werden in einem Ende-zu-Ende-Datenzyklus gängige Data-Governance-Rollen betrachtet (Abb. 2). Ein kontinuierlicher, gemeinsamer Datenzyklus mit verteilten Data-Governance-Rollen gibt dabei eine Struktur vor, um Verantwortlichkeiten festzulegen. Erst abgestimmte, zwischen den Akteuren wirksame Rollen können einen gemeinsamen Datenzyklus herstellen, der sowohl Lücken als auch Konflikte vermeidet.
Der Datenzyklus beginnt mit (1) der korrekten Datenerfassung durch den Data Author und ggf. (2) die anschließende Überprüfung durch Patienten als Data Owner. Die mögliche Rolle eines Data Stewards zur (3) formellen Validierung der erfassten Daten baut zwar darauf auf, ist jedoch in der EHDS-VO nicht klar reglementiert. Sie könnte eine vermittelnde Rolle spielen und dabei das in der EHDS-VO vorgegebene Datenqualitäts und -nützlichkeitslabel (DQNL) umsetzen. Als Ergebnis dieser drei Rollen können in weiterer Folge vollständige und konsistente Daten zeitnah über einen Data Distributor (4) verfügbar gemacht werden. Eine Data-Clearance-Stelle, die zwar in einer Rechtsverordnung zum GDNG1, aber nicht explizit in der EHDS-VO vorgesehen ist, könnte die Daten (5) prüfen und dem Data Custodian (als Data Holder) freigeben. Die dabei vorgesehene Datenqualitätsprüfung sollte mit dem in der EHDS-VO vorgesehenen DQNL kompatibel sein. Das gilt auch für die Pseudonymisierung und Anonymisierung der Daten bei einem Data Custodian bzw. Data Holder. Dort gilt es, die verfügbaren Datensätze mittels des EHDS-Standards Health-DCAT-AP zu beschreiben, damit der Data Provider darauf aufbauend die (6) Daten-Auffindbarkeit gewährleisten kann.
Der vorletzte Schritt des in Abb. 2 skizzierten Datenzyklus liegt in der für die Forschungsfrage passgenauen (7) Zusammenstellung der Daten durch den Data Provider (als Data Controller). Entscheidend dabei ist die informationsverlustfreie Integration der Daten aus verschiedenen Quellen. Ob dies mit den in Deutschland verfügbaren Daten gelingen kann, liegt an national abgestimmten Datenspezifikationen der Data Domain Owner. Die interoperable Zusammenführung mit Daten europäischer Staaten ist in der EHDS-VO jedoch nicht konzipiert. Für die Primär-Datennutzung des EHDS werden zwar europäische Datenformate (EEHRxF) spezifiziert und anderen Staaten über einen National Contact Point for eHealth (NCPeH) – das Gateway zu MyHealth@EU – verfügbar gemacht. Wie diese für die Sekundär-Datennutzung in HealthData@EU verwendbar sein werden, ist jedoch noch nicht geregelt. Die Datenbereitstellung im letzten Schritt des Datenzyklus ermöglicht es Berechtigten, als Data User (8) Datenanalysen durchzuführen. Hierbei können ersichtliche Fehler und relevante Ergebnisse Patienten bzw. ihren Gesundheitsversorgern zurückgemeldet und somit ein neuer Datenzyklus ermöglicht werden. Die EHDS-VO empfiehlt diese Rückmeldungen zwar, überlässt eine nähere Regelung jedoch den Mitgliedstaaten. Unabhängig davon ist die Veröffentlichung der Ergebnisse vorgeschrieben (Art. 61 (4)).
Fazit
Die Betrachtung einer – im Detail noch zu spezifizierenden – Data Governance zeigt auf, wie explizite Rollen Aufgaben der EHDS-VO und des GDNG abdecken und einen lückenlosen Datenzyklus für eine integrative Datenbereitstellung und -nutzung ermöglichen können. Gleichzeitig wird dadurch deutlich, dass derzeit Lücken bestehen, die national überbrückt werden müssten, damit EU- und nationale Regelungen ineinandergreifen. Das betrifft insbesondere den Umgang mit Aufgaben eines Daten Stewards zur Datenvalidierung, Datenqualitätsgewährleistung und der Ertüchtigung des Data Providers zur Dateninteroperabilität an der Schnittstelle nationaler und europäischer Datenformate. Eine Zuweisung dieser Aufgaben an einen Akteur als Data Steward kann für einen fließenden Datenzyklus entscheidend sein. Einige der Lücken könnten durch das Bundesministerium für Gesundheit über Rechtsverordnungen des GDNG oder eine in Planung befindliche Gesetzgebung (GDNG-Nachfolgegesetz) adressiert werden. Andere Lücken könnten durch nachgelagerte Einrichtungen wie dem BfArM, der gematik oder mit Spezifikation beauftragten Institutionen geschlossen werden. Inwiefern die etablierten Akteure, insbesondere die bestehenden Forschungsdateninfrastrukturen in Deutschland, anschlussfähig daran sind und wie diese für die Überbrückung von Lücken eingesetzt werden können, bleibt noch zu analysieren.
1 Verordnung zur näheren Regelung von Verfahren nach dem Gesetz zur verbesserten Nutzung von Gesundheitsdaten
https://www.bundesgesundheitsministerium.de/fileadmin/Dateien/3_Downloads/Gesetze_und_Verordnungen/GuV/G/RefE_GDNGUmsV.pdf
AUTOREN
Dr. Samer Schaat
ist IT-Architekt F&E bei der gematik
Kontakt: samer.schaat(at)gematik.de
Lukas Wrosch
ist EU & Innovation Policy Manager bei der gematik
Kontakt: lukas.wrosch(at)gematik.de