Dass die Forschung mit realen klinischen Daten in Deutschland dringend verbesserungsbedürftig ist, gilt spätestens seit der Corona-Pandemie als Binsenweisheit. Doch bisher tun sich alle Beteiligten schwer: Wer mit Versorgungsdaten forschen möchte, der findet oft keine ausreichend großen, ausreichend qualitätsgesicherten Datensätze und weicht deswegen gerne in die USA aus. Dort wird mit Gesundheitsdaten legal gehandelt, und die datenschutzrechtlichen Beschränkungen sind weit weniger umfangreich als hier zu Lande.
Auch Datenanbietern macht insbesondere Deutschland mit seinem Datenschutzföderalismus das Leben schwer: Medizinische Einrichtungen und Einrichtungsverbünde, die forschungsaffin sind und ihre Daten gern zugänglich machen würden, geben nicht selten auf und ziehen am Ende doch Brandmauern um ihre Einrichtung, nicht aus Überzeugung, sondern um kein Theater zu haben. Die Konsequenz: In Sachen Real-World-Daten-Forschung passiert in Deutschland im internationalen Vergleich wenig. Und das was passiert, ist mit überproportional viel Aufwand verbunden.
Bekannte Gesichter für ein heißes Thema
Hier setzt das neue Unternehmen Honic (Health Data Technologies GmbH) an, das vor Kurzem mit Sitz in Neckarsulm gegründet hat. Ziel ist die Etablierung einer kommerziellen, deutschen Forschungsdatenplattform, die Anbieter:innen und Nutzer:innen von medizinischen Real-World-Daten zusammenbringt. Die Plattform will eine vertrauenswürdige, strikt DSGVO-konforme Nutzung von medizinischen Versorgungsdaten für die Forschung durch all jene ermöglichen, die daran ein legitimes Interesse haben. Es geht also um ein recht heißes Thema in einem Bereich, für den sich nicht zuletzt Unternehmen der Gesundheitsindustrie stark interessieren.
Das neue Unternehmen ist unter anderem deswegen spannend, weil seine fünf Gründer:innen in der Szene keine ganz unbekannten Gesichter sind. Mit dabei sind der ehemalige Chef des health innovation hub des Bundesgesundheitsministeriums, Jörg Debatin, und dessen ehemaliger Managing Director, Henrik Matthies. Weiter Gründer:innen sind Ralf König und Denitza Larsen, beide ebenfalls „ex-hih“. Nummer fünf im Bunde und als einziger branchenfremd ist Ralf Schramm, bisher CTO bei FarmFacts, einem Spezialisten für digitale Management-Lösungen für die Landwirtschaft.
„Honic“ spiele auf Honigbienen an, erläuterte Matthies im Gespräch mit E-HEALTH-COM. Die Bienen schwirren in alle Richtungen aus und bringen Nektar (Daten) zum Bienenstock, der Plattform. Dort entsteht nicht nur einfach Honig, das Forschungsergebnis. Es findet auch eine Art Qualitätskontrolle statt: Nicht jeder Schrott, den so eine Biene anschleppt, wird weiterverarbeitet.
Vor der Forschung steht eine mehrschrittige Depersonalisierung
Konkret nutzt Honic eine existierende Technologieplattform, nämlich StackIt der Schwarz IT Gruppe. Schwarz ist eines der größten deutsches Unternehmen, im Besitz der Dieter Schwarz Stiftung, mit über 4000 Mitarbeitern allein im IT-Bereich: „Die Plattform von Schwarz erfüllt alle technologischen Voraussetzungen, die an eine DSGVO-konforme Datenspeicherung und -verarbeitung zu stellen sind“, betont Matthies. Diese Technologieplattform wird von Honic an die Bedürfnisse des Gesundheitswesens adaptiert. Und sie wird um Dienstleistungen im Sinne einer Auftragsdatenverarbeitung mit explizitem medizinischem Forschungsfokus erweitert: „Wir wollen eine Sekundärnutzung von Versorgungsdaten für die Forschung und Entwicklung möglich machen. Dabei kümmern wir uns um alle Anforderungen, die die DSGVO stellt.“
Im ersten Schritt wollen sich die Neckarsulmer beschränken auf Bilddaten, Labordaten und Medikation, also Datensegmente, die in der Regel bereits heute zumindest vorstrukturiert sind. „Ab 2025 könnten dann Freitextdaten dazukommen“, so Debatin. Die Dienstleistungen des Unternehmens bestehen darin, als erstes eine Qualitätssicherung bei den eingehenden Daten durchzuführen. Für ein konkretes Forschungsprojekt ausgewählte Daten werden zunächst pseudonymisiert. Für die Analyse werden sie in einem zweiten Schritt in aggregierter oder kombinierter Form anonymisiert, um sie dann auszuwerten. Für die komplexe, mehrschrittige Depersonalisierung nutzt Honic die Bundesdruckerei als Datentreuhänderin.
Das ist die technische Ebene. Auf organisatorischer Seite gibt es einen externen Beirat, der jede Forschungsanfrage überprüft. Hier gehe es vor allem darum, ob für die Forschungsanfrage im Sinne der DSGVO ein legitimes gesellschaftliches Interesse vorliege, so Debatin. Nur wenn das gegeben ist, wird im Hinblick auf die spezielle Forschungsanfrage ein anonymisiertes, Use-Case-spezifisches Datenpaket erstellt und dann den Forschenden zugänglich gemacht. Und dies nur innerhalb der gesicherten Plattform: „Wir werden keine Daten exportieren, die Daten bleiben auf unseren Systemen“, so Debatin.
Kein Widerspruch zur MI-I
Natürlich sind DSGVO-konforme Forschungsdateninfrastrukturen für die Medizin keine völlig neue Idee. In Deutschland nimmt sich nicht zuletzt die Medizininformatik-Initiative (MI-I) dieser Thematik an. In diesem Kontext wurden auch diverse Tools bzw. Konzepte für Depersonalisierung und Einverständniserklärung, Stichwort Broad Consent, entwickelt und mit den Datenschützern abgestimmt. Debatin und Matthies sehen hier keinen Widerspruch und auch keine Konkurrenz, sondern eher sich ergänzende Ansätze.
Zum einen fokussiere man sich mit der Honic Plattform medizinische Daten aus der ambulanten Versorgung, mithin auf eine Zielgruppe von Leistungserbringern, die bei der universitären MI-I nicht abgebildet sind. Zum anderen geht es darum, zu zeigen, dass unter Berücksichtigung von DSGVO und deutscher Datenschutzgesetzgebung etwas „mehr geht“ als bei der universitär ausgerichteten MI-I. Insbesondere wird für die Forschung über die Honic Plattform kein Broad Consent erforderlich sein, außerdem werden auch Wissenschaftler:innen von forschenden Medizinunternehmen Zugang erhalten. Letzteres gilt aber auch für die MI-I: Dort können forschende Unternehmen für medizinische Forschungszwecke einen Antrag auf Datennutzung stellen. Dieser muss von den MI-I Instanzen genehmigt werden, und das Unternehmen erhält dann Zugriff auf die Daten in codierter Form.
Der Verzicht auf den Broad Consent werde zum einen durch die mehrstufige Depersonalisierung möglich, zum anderen durch besondere Sicherheitsmaßnahmen wie etwa den Verzicht auf genetische Daten sowie spezielle Regeln zum Umgang mit Daten im Kontext seltener Erkrankungen. Das ganze Konzept wird in enger Abstimmung mit dem Datenschutzbeauftragten des Landes Baden-Württemberg entwickelt, betont Debatin.
Von Qualitätssicherung bis KI-Entwicklung
Was sind nun mögliche Einsatzfelder für die Sekundärdatennutzung in der Art, in der Health Data Technologies sie anbieten möchte? Die Gründer:innen um Matthies und Debatin gehen davon aus, dass es zum einen innerhalb von Verbünden ein Interesse an einer einrichtungsübergreifenden Analytik der jeweils eigenen Daten gibt. Das ist bereits heute nicht unmöglich, es würde mit der neuen Plattform aber deutlich einfacher. Als wichtige potenzielle Kund:innen werden aber auch Pharmaunternehmen und HealthTech-Unternehmen gesehen. Das sind jene Akteure, die bei der politisch initiierten Forschungsdatenanalytik – Stichwort Forschungsdatenzentrum (FDZ) des BfArM – bisher explizit gesetzlich nicht zum Zug kommen.
Ein besonders interessantes Szenario, für das bisher vielfach auf US-Datensätze zurückgegriffen werden muss, ist die Entwicklung bzw. das Training von Maschinenlernalgorithmen. Aber auch Analysen zur Korrelation von Arzneimitteln mit Bildgebungs- bzw. Laborbefunden könnten für Unternehmen der Gesundheitsindustrie attraktiv sein. „Die Einsatzmöglichkeiten sind aus unserer Sicht sehr breit gestreut. Um in der Vielfalt nicht zu ersticken, konzentrieren wir uns zuncähst bewusst auf Bild-, Medikations- und Labordaten“, so Debatin.