E-HEALTH-COM ist das unabhängige Fachmagazin für Gesundheitstelematik, vernetzte Medizintechnik , Telemedizin und Health-IT für Deutschland, Österreich und die Schweiz.
Mehr

Für das ePaper anmelden

Geben Sie Ihren Benutzernamen und Ihr Passwort ein, um sich an der Website anzumelden

Anmelden

Passwort vergessen?

Top-Thema |

Von der ePA zum Gesundheitsdatenraum

In die elektronische Patientenakte (ePA) werden große Hoffnungen gesetzt. In erster Linie soll sie Versorgungsprozesse unterstützen und Versicherte in den Mittelpunkt der Informierung stellen. Könnte die ePA durch ihre angedachte zentrale Rolle im Gesundheitssystem und der Verwendung von Datenstandards auch als Datenplattform für datenintensive Anwendungen wie Systeme der Künstlichen Intelligenz (KI) dienen?

Bild: © everythingpossible – stock.adobe.com; 488023797; Stand.-Liz

Mit der Telematikinfrastruktur und der Einführung der ePA (nach §341 SGB V) soll eines der drängendsten Probleme der Digitalisierung des Gesundheitswesens angegangen werden: Der einheitliche Austausch und die Zusammenführung von Versorgungsdaten aus den Datensilos der Gesundheitsdienstleister. Neben direkten Kommunikationskanälen wie KIM (Kommunikation im Medizinwesen) und zukünftig TIM (TI-Messenger) bleiben Patient:innen dabei weiterhin das Bindeglied zwischen den Gesundheitsdienstleistern – denn die ePA ist versichertengeführt. Erst auf aktiven Wunsch der Patient:innen müssen Gesundheitsversorger die ePA mit Daten zur aktuellen Behandlung befüllen. Das bedeutet auch, dass die ePA derzeit als eine zentralisierte Sekundärdokumentation von Primärdaten, die bei den jeweiligen Gesundheitsdienstleistern vorgehalten werden, umgesetzt ist. Ihre Rolle erfüllt sie u. a. mittels einheitlicher Formate für die Übertragung der in den zahlreichen proprietären IT-Systemen der Gesundheitsdienstleister gespeicherten Daten.


Diese Funktion wird durch die Verwendung internationaler Standards wie FHIR® und SNOMED CT® erbracht werden, beispielsweise mittels Medizinischer Informations-objekte (MIO) zum digitalen Impfpass, Zahnbonusheft, Mutterpass und Kinderuntersuchungsheft. Indem sie eine gemeinsame Sprache für die medizinische Dokumentation vorgeben, also syntaktisch und semantisch interoperabel sind, können MIOs – technische Umsetzung durch die IT-Hersteller vorausgesetzt – von den IT-Systemen aller relevanten Gesundheitsdienstleister gelesen, interpretiert und bearbeitet werden. Denn erst wenn die ePA nicht nur einheitlich befüllt, sondern auch von möglichst vielen Akteuren genutzt wird, könnte sie ein Dreh- und Angelpunkt von Patientendaten werden. Unter der Annahme, dass die ePA nach Überwindung der Einstiegshürden kontinuierlich genutzt wird, stellt sich die Frage, inwiefern sie die Anforderungen datenintensiver Anwendungen, wie KI-Systeme, erfüllen und ihre Diffusion vorantreiben kann.   


Digitale Daten in Patientenakten: Quantität reicht nicht
KI-Systeme erbringen ihren Nutzen für die Gesundheitsversorgung, indem sie bspw. Zusammenhänge in Befunddaten diagnostisch nutzbar machen und präventive Vorhersagen treffen [1]. Dafür werden aktuell bevorzugt Algorithmen des maschinellen Lernens (ML) eingesetzt, die aus großen Datenmengen statistische Zusammenhänge lernen und sie in digitalen Anwendungen operationalisieren. Die wichtigste Voraussetzung dieser Methoden ist die Verfügbarkeit maschineninterpretierbarer, repräsentativer Daten. Dort wo diese bereits in ausreichender Qualität verfügbar sind, wie bei maschinengenerierten Bilddaten, zeigen KI-Systeme in der Medizin besonders gute Erfolge. Die Grundlage dafür sind hoch- und einheitlich strukturierte Daten, die wenig semantische Interpretation für ihre maschinelle Verarbeitung erfordern (wie z. B. DICOM-Bilddaten und graustufencodierte Pixel). Maschinelle Lernalgorithmen benötigen außerdem repräsentative Beispieldaten, die alle relevanten Eigenschaften (sog. Features, z. B. zur Repräsentation der Tumorkontur in digitalen Bildbefunden) für das Klassifikationsziel abdecken (z. B.  die Erkennung eines bösartigen Tumors). Wenn die für die korrekte Klassifikation entscheidenden Eigenschaften jedoch vorab nicht bekannt sind, besteht das Risiko von Datenverzerrungen (Bias). Deswegen sind u. a. Spezialfälle, wie im Fall seltener Erkrankungen, aktuelle Herausforderung für ML-Algorithmen.


Gerade der Einsatz von KI-Algorithmen mit Daten elektronischer Patientenakten in großen US-amerikanischen Krankenhäusern zeigt auf, dass die verkürzte Forderung nach mehr Daten unzureichend ist. Das Promoting Interoperability Program der US-Regierung (ehemals meaningful use of electronic health records), das Anreize für interoperable Electronic Health Record (EHR) schaffen soll, zeigt die Grenzen politischer Maßnahmen in diesem Bereich auf. Die Daten sind nun in ausreichender Menge vorhanden, aber nicht in der für eine zuverlässige Gesundheitsversorgung benötigten Qualität. Das zeigt sich besonders beim Einsatz von KI-Systemen großer EHR-Anbieter, die unzureichende Ergebnisse, z. B. bei der Abschätzung des Sepsisrisikos, liefern [2].


Welche Nischen könnten KI-Systeme bei elektronischen PAtientenakten besetzen?
Menschenerfasste Daten, wie sie in EHR vorliegen, sind im Vergleich zu maschinengenerierten Daten, wie etwa Bilddaten, häufig lückenhaft. In der Regel sind bisherige Erfolge von EHR-basierter KI in der Medizin mit kontrolliert erhobenen oder sorgsam annotierten Daten erzielt worden [3], mit dem „Wildwuchs“ der Daten aus dem realen Versorgungsalltag müssen KI-Systeme noch umgehen lernen. Wenn jedoch die Datenverfügbarkeit zu einem überstürzten Einsatz von KI-Systemen verlockt, wird der übernächste vor dem nächsten Schritt eingegangen. Erst wenn sich die Daten in der direkten Unterstützung von Gesundheitsdienstleistern und Patient:innen bewähren, werden sie ggf. vervollständigt. Gleichzeitig wird durch die ­Nutzungsmuster der ePA seitens der Gesundheitsdienstleister deutlicher, in welchen Nischen ePA-basierte KI-Systeme die Gesundheitsversorgung unterstützen können. Ein Beispiel sind Systeme, die bei der Übersicht, Zusammenführung und Navigation von umfangreichen ePA-Daten unterstützen.


Etliche wissenschaftliche Studien zu den Herausforderungen EHR-basierter KI-Systeme zeigen die wichtige Rolle einer konsistenten Datengrundlage (z. B. [4]). Die hohe Anzahl und Vielfalt an Datenfeldern und -formaten – innerhalb der EHR eines Anbieters – und deren unzuverlässige Befüllung erfordern in der Regel eine manuelle Gruppierung der Eingangswerte für ML-Algorithmen (sog. feature engineering z. B. von demografischen Daten, Diagnosen und Medikamenten). Das klappt besonders gut mit einheitlich codierten Daten und Zahlenwerten. Neben einer einheitlichen Repräsentation von Patientendaten als „holy grail of clinical deep learning research“ [5] werden die Herausforderungen im Umgang mit sequentiellen Abhängigkeiten (z. B. die Sequenz medizinischer Prozeduren) und der Mangel an universellen Benchmarks genannt. (Im Vergleich sind pixelbasierte DICOM-Bilder für ML-Algorithmen deutlich umgänglicher.) All diese Herausforderungen verdeutlichen, dass nicht der Datenhunger statistischer Lernalgorithmen die größte Hürde für zuverlässige EHR-basierte KI-Systeme darstellt, sondern eine zuverlässige Datenbasis. Bevor EHR von KI-Systemen genutzt werden können, müssen ihre Daten sehr aufwendig vorverarbeitet und integriert werden. Diese Lücke haben z. B. Anbieter wie Google und Microsoft erkannt und bieten Cloud-Dienste für ML-Algorithmen zur einheitlichen Vorverarbeitung und Zusammenführung von Gesundheitsdaten an.


MIOs könnten die KI-Tauglichkeit der ePA verbessern
Wie verhalten sich nun die ePA und ihre MIOs zu den Herausforderungen EHR-basierter KI-Systeme? Denn auch wenn in USA eingesetzte EHRs nicht direkt der ePA in Deutschland entsprechen, können die Schwächen Ersterer als analytischen Ausgangspunkt für ePA-basierte ML-Algorithmen dienen. Der Mangel einer lückenhaften Befüllung von EHR wird wohl auch bei der ePA nicht grundlegend beseitigt werden, solange sie eine versichertengeführte Sekundärdokumentation medizinischer Dokumente abbildet. Denn aufgrund der steigenden Dokumentationslast wird tendenziell der zusätzliche Aufwand bei der Befüllung der ePA durch Gesundheitsdienstleister verständlicherweise auf ein Minimum beschränkt.


Entscheidend dabei ist die Frage nach der Verlässlichkeit und Vollständigkeit dieser Daten. Wird bspw. auf einen „Kerndatensatz“ in ePA-Dokumenten geachtet, ohne den Daten nicht sinnvoll (durch Mensch oder Maschine) medizinisch interpretiert werden können? Erst dann wird der große Vorteil einheitlicher Daten in der ePA für KI-Systeme wirksam. Die in den MIOs üblichen, engen Vorgaben bei den FHIR-Profilen, sodass diese nicht flexibel befüllt werden, könnten dabei Verlässlichkeit schaffen.
Eine besondere Rolle spielt die einheitliche Kodierung medizinischer Information in der ePA, bevorzugt in SNOMED CT®. Denn nur wenn Daten gleich bezeichnet und strukturiert werden, wenn Gleiches gemeint ist, sind sie gemeinsam verwendbar. Das betrifft sowohl die Kodierung und Formatierung von Eingangswerten (z. B. mögliche


Risikofaktoren wie einheitlich formatierte Geburtsdaten) als auch von Ausgangswerten (z. B. Diagnosen). Gerade SNOMED CT® bietet jedoch nicht nur standardisierte Terminologien für die Vereinheitlichung medizinischer Begriffe, wie derzeit hauptsächlich in den MIOs der ePA verwendet, sondern kann ausdrucksstarke Aussagen maschineninterpretierbar abbilden. Durch diese Funktion können bspw. sequentielle Informationen zu medizinischen Verläufen maschineninterpretierbar werden – bisher ein Mangel EHR-basierter ML-Systeme (s. o.).


Telemedizin: Wie echtzeitfähig ist die ePA?
Aktuell ist die ePA als digitales Aktensystem medizinischer Dokumente umgesetzt. Als Dreh- und Angelpunkt von Patientendaten müsste sie jedoch weitere Datenquellen für digitale Anwendungen öffnen, insbesondere wenn die Daten im Zuge der pflichtversicherten Versorgung erhoben werden. Telemedizinisches Monitoring und digitale Gesundheitsanwendungen (DiGA) geben bereits die Richtung vor. Denn Daten sollten in einem digitalisierten Gesundheitssystem nicht mehr nur anhand grobgranularer (wenn auch digitalisierter) Dokumente ausgetauscht werden. Gerade der FHIR-Standard spielt seine Stärken erst richtig aus, wenn er zu einem feingranularen, versorgungsprozessorientierten Datenaustausch genutzt wird.


In diesem Sinn werden die aktuellen Daten, die im Prozess benötigt werden, in Echtzeit abgerufen (z. B. die aktuell gültige Anamnese) und versendet (z. B. aktuelle Blutdruckwerte). Das setzt selbstverständlich eine hohe Datenverfügbarkeit in verteilten Systemen voraus, so wie das in anderen Branchen wie im Finanzwesen oder im Flugwesen der Fall ist. Gerade in der Telemedizin ist der kontinuierliche Versand bspw. von Monitoringdaten und dessen automatisierte Auswertung in telemedizinischen Zentren (TMZ) zur Erkennung des Interventionsbedarfs eine wichtige Voraussetzung für die Skalierbarkeit telemedizinischer Versorgung [6]. Damit KI-Systeme dabei unterstützen können, benötigen sie sowohl historische Monitoringwerte statt Trainingsdaten als auch die jeweiligen aktuellen Werte als Echtzeitdaten. Wenn ein TMZ entsprechend der G-BA-Richtlinie [7] spätestens am Folgetag des Datenerhalts die ärztliche Interventionsnotwendigkeit entscheiden muss, ist eine solche kontinuierliche Datenauswertung sogar unabdingbar. Entscheidend wird eine solche Datenverfügbarkeit, wenn eine individualisierte telemedizinische Versorgung gewährleistet werden soll, statt bloß zu überwachen, ob beim Patienten ein generischer Schwellwert überschritten wird.  


Ausblick föderierter Gesundheitsdatenraum
Die standardisiert-strukturierten Patientendaten der ePA sind somit hinsichtlich ihrer Datenqualität grundsätzlich als Trainingsdaten für ML-Algorithmen geeignet, auch wenn sie als Sekundärdokumentation wohl nur einen Auszug der bei den Gesundheitsdienstleistern vorgehaltenen Primärdaten darstellen. Weitere entscheidende Datenanforderungen von ML-Algorithmen sind in zentralisierten und Ende-zu-Ende-verschlüsselten ePAs der einzelnen Versicherten jedoch nur mangelhaft erfüllt. Denn in der Regel kann erst durch die Zusammenführung von Daten unterschiedlicher Patienten ein generalisierbares ML-Modell gelernt werden, das ggf. mit patientenindividuellen Daten der ePA präzisiert und angewandt werden kann. Nur so können z. B. mögliche Erkrankungszusammenhänge, die bei anderen Patienten rückblickend erkannt wurden, vorausschauend für die Früh- und Risikoerkennung individueller Patient:innen vor Auftreten der zu klassifizierenden Erkrankung verwendet werden.


Die dafür benötigte Zusammenführung repräsentativer Patientendaten ist außerhalb von Forschungsprojekten (z. B. der Medizininformatik-Initiative) unüblich und im Rahmen der gesetzlichen Krankenversicherung jenseits der ab 2023 verfügbaren Datenspende an ein Forschungsdatenzentrum nicht vorgesehen. Eine dortige zentralisierte Datenintegration wird jedoch mit im Zuge der Digitalisierung fortwährend hinzukommenden Datenquellen immer herausfordernder und schlecht skalierbar. Auch aufgrund datenschutzrechtlicher Probleme bei der Zusammenführung von Daten wird deswegen verstärkt der Einsatz föderierter ML-Algorithmen propagiert. Dabei wandert der ML-Algorithmus quasi zu den verteilt liegenden Daten statt umgekehrt.


Mit einer schrittweisen Öffnung bestehender Datensilos im Gesundheitswesen und der fortlaufenden Verfügbarkeit neuer Datenquellen durch Wearables und Apps spannt sich ein Gesundheitsdatenraum auf, der nicht mehr zu einer zentralisierten ePA reduziert werden kann. Vielmehr sollte die Standardisierung der ePA auf diesem verteilten Gesundheitsdatenraum ausgeweitet und somit föderiert werden, um standardisierte Datenbausteine in einem Datenökosystem flexibel zusammenzusetzen und nutzen zu können. Vorgefertigte medizinische Dokumente in einer ePA wären dann nur mehr eine spezifische Zusammensetzung und Sichtweise auf diese Daten. Für KI-Systeme eröffnen sich dadurch gezielte Datenzugänge. Statt zu versuchen, aus vorhandenen Daten das Beste zu machen, können KI-Systeme gezielt jene verteilt liegenden Primärdaten anfragen und abrufen, die sie benötigen – ganz im Sinne der Stärke des FHIR®-Ansatzes. Im Fall einer dünnen Datenlage – z. B. bei seltenen Erkrankungen – kann ein solcher Ansatz ausschlaggebend sein, um für die jeweilige Problemstellung repräsentative Daten in der benötigten Qualität zu erhalten.


Insgesamt kann erwartet werden, dass gezielt verfügbare Daten in den Primärsystemen der Gesundheitsdienstleister – so sie standardisiert vorliegen – die Datenqualitätsvoraussetzungen von ML-Algorithmen besser erfüllen als deren vermutlich auf ein Minimum beschränkte Sekundärdokumentation in der ePA. Die für ein solches Szenario einer verteilten Datenverwendung nötigen Zugangs- und Berechtigungsfragen werden im Zukunftslabor der gematik basierend auf dem UMA-Protokoll (User Managed Acess) der Kantara Initiative erörtert. Das Potenzial dieses Ansatzes zur Herstellung der für datenintensive Anwendungen benötigten Durchlässigkeit eines Gesundheitsdatenraumes wird in einem zukünftigen Artikel näher ausgeführt.

 

Referenzen
[1] https://www.digitale-technologien.de/DT/Redaktion/DE/Downloads/Publikation/SSW_Policy_Paper_KI_Medizin.html
[2] https://mindmatters.ai/2021/08/an-epic-failure-overstated-ai-claims-in-medicine/
[3] https://www.nature.com/articles/s41467-021-20910-4
[4] https://www.sciencedirect.com/science/article/pii/S1532046419302564
[5] https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6043423/
[6] https://www.digitale-technologien.de/DT/Redaktion/DE/Downloads/Publikation/SDW/2021_10_06_Telemed-Studie.html
[7] https://www.g-ba.de/downloads/39-261-4648/2020-12-17_MVV-RL_Telemonitoring-Herzinsuffizienz_BAnz.pdf

 

Zum Autor:

Dr. Samer Schaat
ist medizinischer Informatiker und war an der MedUni Wien im Bereich der Interoperabilität von Forschungsdaten tätig. Am DZNE Rostock entwickelte er sensorbasierte Assistenzsysteme für Menschen mit Demenz. Zuletzt wirkte er an der Spezifikation der MIOs für die deutsche ePA mit.
Kontakt: s.schaat(at)mailbox.org