E-HEALTH-COM ist das unabhängige Fachmagazin für Gesundheitstelematik, vernetzte Medizintechnik , Telemedizin und Health-IT für Deutschland, Österreich und die Schweiz.
Mehr

Für das ePaper anmelden

Geben Sie Ihren Benutzernamen und Ihr Passwort ein, um sich an der Website anzumelden

Anmelden

Passwort vergessen?

Top-Thema |

KI nimmt die Kardiologie im Sturm

Keine andere medizinische Disziplin hat sich so der Künstlichen Intelligenz verschrieben wie die Kardiologie. Große Studien werden durchgeführt, und die europäische Fachgesellschaft ESC veranstaltet sogar einen eigenen KI-Kongress. Längst geht es nicht mehr nur um experimentelle Tools: Die Zeichen stehen auf Implementierung.

Bild: © Pakawadee – stock.adobe.com, 886788434, Stand.-Liz.

Kardiologie und Künstliche Intelligenz (KI), das geht fast so gut zusammen wie Kardiologie und Katheter. KI ist von kardiologischen Kongressen mittlerweile nicht mehr wegzudenken, und es findet dort nicht mehr nur in Nebenzimmern statt. Besonders die Europäische Gesellschaft für Kardiologie (ESC) zeigt sich hier offen und auch wagemutig. Bei der Jahrestagung 2025 im August in Madrid gab es erstmals eine ganze „Late-Breaking-Session“, in der ausschließlich klinische Studien mit KI-Nutzung vorgestellt wurden. Mehr noch: Ende November 2025 war Berlin Gastgeber des Digital & AI Summit der ESC, ein zum zweiten Mal stattfindendes Format, bei dem zwei Tage lang über nichts anderes als über digitalisierte kardiologische Versorgung mit und (selten) ohne KI gesprochen wurde.


Das EKG-Revival hält an
Ein zentrales Thema und Gegenstand unzähliger Forschungs- und Entwicklungsprojekte ist nach wie vor das EKG, die älteste Gerätediagnostik in der Kardiologie. Das EKG wird heute umfangreich mit KI hinterlegt und rückt dadurch fast 150 Jahre nach seiner Erfindung einmal mehr ins Rampenlicht. Der Autor dieses Beitrags war in den frühen Nullerjahren selbst in der Kardiologie. In jener Zeit gehörte es zum guten Ton, sich über die damals schon existierenden, regelbasierten KI-Auswertungen von 12-Kanal-EKGs lustig zu machen: Hach, wie dumm die Maschine doch ist.


Heute lacht niemand mehr. Diverse Systeme, die nicht rein regelbasiert arbeiten, sondern Bild-KI-Modelle nutzen, werben um die Gunst der kardiologischen Anwender:innen. Sie tragen Namen wie PMcardio, ecgXfusion oder Willem, und sie müssen nicht viel für sich werben. Den neuen Tools geht es sowohl um die klassische Befundung als auch darum, dem EKG Informationen zu entlocken, die für das menschliche Auge nicht ohne Weiteres erkennbar sind.


Wenige Sekunden statt elf Minuten
Willem ist ein Beispiel für die klassische Befundung. Ruben Abbou von dem Unternehmen Idoven berichtete darüber in Berlin. Es handelt sich um eine noch recht neue, cloudbasierte, CE-zertifizierte EKG-Analyse-Plattform, die auf das Diagnostizieren von Arrhythmien spezialisiert ist. Für die Routineversorgung ist das potenziell hilfreich. Denn Arrhythmie-Diagnostik ist etwas schwieriger – und bei jungen Kardiolog:innen oft unbeliebter – als die rasch erlernbare, EKG-basierte Herzinfarkt- und Ischämiediagnostik, das zweite große Einsatzfeld des traditionellen EKGs. Willem ist CE-zertifiziert, lässt sich in unterschiedlichste klinische Informationssysteme integrieren und kann mit EKGs aller Art als Ausgangsmaterial arbeiten, vom 12-Kanal-EKG über EKGs ambulanter EKG-Devices bis hin zu den EKG-Dateien implantierbarer kardialer Monitore. 


Die Software analysiert derzeit vier Intervalle, konkret P, PR, QT und QRS. Damit erkennt sie auf Expertenniveau insgesamt 22 unterschiedliche Arrhythmien. Der genutzte KI-Algorithmus sei für jeden einzelnen Befund besser als regelbasierte EKG-Analysen, so Abbou. Nicht nur das, es wird auch noch Zeit gespart. Zumindest für das Teilgebiet der Arrhythmien sinke die durchschnittliche Auswertezeit eines 12-Kanal-EKGs von elf Minuten auf wenige Sekunden. Solche Zahlen sind immer mit etwas Vorsicht zu genießen, denn natürlich wollen EKG-befundende Ärztinnen und Ärzte das komplette Bild und nicht nur den Blick auf ein Teilspektrum. Dennoch, für junge Ärztinnen und Ärzte, die Ischämie-EKG können, aber Rhythmus-EKG noch nicht, ist das schon ein Quantensprung. Auch in der allgemeinmedizinischen Versorgung, wo das Wissen um Arrhythmie-EKGs sehr begrenzt ist, könnte ein solches Tool nutzenstiftend sein.


Kostenerstattung für KI-EKG? In Südkorea schon Realität

Ein Land, das in Sachen KI-gestützte EKGs weit vorn ist, ist Südkorea. Hier werde vor allem versucht, dem EKG zusätzliche Informationen zu entlocken und diese dann auch versorgungsrelevant zu machen, sagte bei der Berliner Tagung Prof. Dr. Min Sung Lee von dem Unternehmen Medical AI Co., das eine AiTiA genannte Serie an KI-Algorithmen entwickelt hat. Mehrere dieser Algorithmen würden mittlerweile in Südkorea in der Versorgung umfangreich genutzt, so Lee, und einige würden von den dortigen Kostenträgern auch erstattet.
Ein Beispiel ist AiTiALVSD, ein Algorithmus, der die Pumpfunktion der linken Herzkammer (LVEF) auf Basis eines 12-Kanal-EKGs abschätzt und der insbesondere darauf getrimmt ist, eine LVEF von 40 Prozent oder weniger zu erkennen. Klinisch ist das wichtig bei Patient:innen mit unklaren Wassereinlagerungen. Die Diagnosemethode der Wahl ist die Echokardiographie, aber die ist nicht überall schnell verfügbar. AiTiALVSD ist mittlerweile ein Exportschlager: Bei der ESC-Konferenz im August stellten die Südkoreaner eine Studie vor, die den Algorithmus anhand einer niederländischen Kohorte mit anderen derartigen Algorithmen verglichen hatte. Obwohl AiTiALVSD auf Basis einer asiatischen Population entwickelt wurde, gewann es diesen Direktvergleich.


Ein weiteres interessantes klinisches Einsatzszenario für KI-EKGs ist die Früherkennung einer kardialen Amyloidose – oder anderer Erkrankungen. Bei der Amyloidose könnte das EKG Teil eines mehrstufigen Abklärungskonzepts sein, das einen gezielteren und damit nicht zuletzt kosteneffizienteren Einsatz von aufwendigerer Gerätediagnostik erlaubt. Prof. Dr. Evangelos Oikonomou vom kardiovaskulären Data Science Lab der Yale University konnte in einer aktuellen, retrospektiven Studie zeigen, dass der EKG-Algorithmus Amyloid-Ablagerungen im Mittel etwa drei bis fünf Jahre vor der szintigraphischen Diagnose erkennt. Auch das schon erwähnte Willem-Tool wird derzeit auf Früherkennung einer kardialen Amyloidose hin trainiert.


Klinische Studien erforschen Implementierungsstrategien

Ein anderes Land, das sich sehr um den Einsatz von KI in der Kardiologie bemüht, ist Großbritannien. Im Fokus stehen dort Implementierungsstudien mit dem Ziel, nicht so sehr Kardiolog:innen zu unterstützen, sondern vielmehr die breite Versorgung zu verbessern. Für viel Aufmerksamkeit gesorgt hat die ASSIST-HF-SIRIO-Studie, die von Prof. Dr. Diana Gorog von der Kardiologie an der medizinischen Fakultät des Imperial College London bei der ESC-Tagung in Madrid vorgestellt wurde.


Es handelte sich um eine Pilotstudie mit 60 Teilnehmer:innen, die allesamt wegen einer ersten Herzinsuffizienz-Episode im Krankenhaus gewesen waren und die gerade oder wenige Tage zuvor entlassen wurden. Die Patient:innen waren allesamt noch symptomatisch, klinisch in den NYHA-Klassen II bis IV, und entsprechend gab es Einstellungsbedarf auf medikamentöser Seite. Es galt, die vier prognoseverbessernden Herzinsuffizienzmedikamente ambulant rasch aufzudosieren, so wie es die Leitlinien empfehlen. Dies vermeidet erneute Klinikeinweisungen und auch Todesfälle, es gelingt aber in der realen Versorgung nicht besonders gut.

Abbildung 1: ASSIST-HF-SIRIO-Studie: Anteil der Patient:innen mit symptomatischer
Herzinsuffizienz, die 12 Wochen nach Entlassung hinsichtlich der Hauptmedikamentenklassen auf maximal tolerabler Dosis waren. Rot: KI-Assistent. Blau: Standardversorgung.

 

Zieldosierungen werden schneller erreicht
In der ASSIST-HF-SIRIO-Studie trat jetzt ein KI-gestützter Versorgungsalgorithmus gegen Standardversorgung an. Im KI-Arm wurden die Patient:innen alle zwei Wochen von einer Assistenzkraft ohne jegliche medizinische Ausbildung gesehen. Auf Basis einer Laboruntersuchung und der leitlinienbasierten Empfehlung der KI wurde die Medikation auftitriert, wobei sich jeweils ein Telekardiologe oder eine Telekardiologin noch einmal die KI-Empfehlung ansah und sie abschließend freigab.


Die Ergebnisse waren sehr eindrucksvoll. Nicht nur waren die Patient:innen praktisch durchweg zufrieden mit der KI-gestützten Versorgung und fühlten sich gut aufgehoben. Sie erreichten auch wesentlich schneller und zahlreicher die optimale Dosis der Medikamente. Nahezu alle Patient:innen im KI-Arm waren nach 12 Wochen bei allen oder nahezu allen Standardmedikamenten auf der maximal tolerierten Dosis, während das bei Standardversorgung je nach Medikamentenklasse jeweils nur eine teils kleine Minderheit geschafft hatte (Abbildung 1). 

Abbildung 2: ASSIST-HF-SIRIO-Studie: Anteil der Patient:innen mit symptomatischer Herzinsuffizienz (NYHA III/IV), die 12 Wochen nach Entlassung in NYHA-Klasse I waren.
Rot: KI-Assistent. Blau: Standardversorgung.

 

Auch hinsichtlich der Verbesserung der Symptomatik schnitten die KI-versorgten Patient:innen besser ab (Abbildung 2), und bei den aufgrund der Studiengröße rein exploratorischen Endpunkten „schwere kardiovaskuläre Ereignisse“ und „erneute Klinikeinweisung wegen Herzinsuffizienz“ gab es ebenfalls einen deutlichen Trend zugunsten der KI-Versorgung. „Wir werden das jetzt in einer großen, randomisierten Studie überprüfen“, so Gorog. „Virtuelle Assistenten auf Basis von generativer KI haben das Potenzial, bestehende Lücken im Herzinsuffizienz-Management zu überbrücken und gleichzeitig den Ressourceneinsatz zu optimieren.“ 


Neue Studienkonzepte an der Schnittstelle von RCT und Real-World

Nun ist KI kein Medikament, entsprechend braucht es für eine großflächige Validierung KI-gestützter Versorgungsszenarien jenseits von Pilotstudien etwas anders geartete Studien als in der Arzneimittelwelt. Wie solche Studien konkret aussehen können, zeigt die erneut britische TRICORDER-Studie, die die Potenziale eines KI-gestützten Stethoskops in der allgemeinmedizinischen Versorgung in Nordwest-London ausgeleuchtet hat. Die Studie, deren Ergebnisse von Dr. Patrik Bachtiger vom Imperial College London ebenfalls bei der ESC-Tagung in Madrid vorgestellt wurden, hat ihren primären Endpunkt zwar verfehlt. Das Studiendesign war dennoch wegweisend.


Konkret ging es um die Früherkennung von Herzinsuffizienz, Vorhofflimmern und Herzklappenerkrankungen. In Nordwest-London wurden 213 allgemeinmedizinische Praxen Cluster-randomisiert zu Nutzung des KI-Stethoskops oder Standardversorgung. Auf diese Weise konnte eine enorme Zahl an Patientenkontakten generiert werden. Der Aufwand war dennoch überschaubar, weil eine Real-World-Datenquelle des NHS genutzt wurde, statt klinische Endpunkte mühsam einzeln zu erheben. Vorstellen kann man sich das ähnlich wie den künftigen Forschungsdatensatz der deutschen ePA. Dieses Vorgehen hatte zwei Kardinalvorteile: Die beteiligten Praxen mussten nichts zusätzlich dokumentieren, und die beteiligten Patient:innen mussten keine informierte Einwilligung unterschreiben, weil für die Forschung auf der NHS-Datenbank eine pauschale Einwilligung gilt, erneut ähnlich wie für die deutsche ePA geplant.

Abbildung 3: Sicherheitsendpunkt der AI-Gatekeeper-Studie aus Südkorea: weniger schwere kardiovaskuläre Ereignisse bei KI-basierter Risikostratifizierung bei Verdacht auf KHK.

 

KI-Triage bei Verdacht auf KHK kann überzeugen
Auch in Südkorea wird jenseits von reinen EKG-Algorithmen an der Implementierung KI-gestützter Versorgungsszenarien gearbeitet. Prof. Dr. Sung Bae vom Yongin Severance Krankenhaus der Yonsei Universität berichtete davon. In seiner AI-Gatekeeper-Studie ging es um die sehr versorgungsrelevante Frage, ob sich durch KI bei Verdacht auf koronare Herzerkrankung (KHK) unnötige Diagnoseschritte vermeiden lassen. Bisher hängt bei diesen Menschen mit unklaren Brustschmerzen das Vorgehen – Koronar-CT, funktionelle Bildgebung oder gleich Herzkatheter – von der klinischen Vortestwahrscheinlichkeit ab.


Für die AI-Gatekeeper-Studie wurde jetzt ein gemischtmodales KI-Modell zurate gezogen, das klassische Risikofaktoren, einen Röntgen-Thorax, ein 12-Kanal-EKG und ein transthorakales Echo integrierte und darauf aufsetzend die Wahrscheinlichkeit einer obstruktiven KHK abschätzte. Primäre Endpunkte waren die Effektivität, gemessen an unnötiger zusätzlicher kardiovaskulärer Diagnostik (Koronar-CT oder Katheterangiographie) und Sicherheit, definiert als schwere unerwünschte kardiovaskuläre Ereignisse (Tod jeglicher Ursache, Schlaganfall/Myokardinfarkt, Klinikeinweisung wegen akutem Koronarsyndrom). Auch hier waren die Ergebnisse beachtlich: Der Anteil der Patient:innen mit unnötiger Diagnostik konnte um rund 75 Prozent reduziert werden, von 37,0 Prozent bei klassischer Risikostratifizierung auf nur noch 8,8 Prozent bei KI-Stratifizierung. Auch aufseiten der Sicherheit war die KI-Risikoabschätzung relevant überlegen (Abbildung 3).


Bitte mal die Ehefrau fragen!
Dass KI in der Kardiologie auch einfach Arbeitserleichterung sein kann, zeigte Dr. Michal Nedoszytko von den Cliniques de l’Europe in Brüssel beim Berliner ESC-Summit Ende November. Der Kardiologe berichtete über das Tool previsit.ai. Der Name ist Programm, es handelt sich um eine KI-Unterstützung für das Aufnahmegespräch. Vor dem Arztbesuch erhält die Patientin oder der Patient einen Link zu einem KI-Assistenten, der ein Vorgespräch führt, eine „Prävisite“. Die Software bereitet die Ergebnisse auf und übernimmt wichtige Informationen schon mal vorläufig in die Patientenakte. Entsprechend gut vorbereitet kann der Arzt oder die Ärztin dann in das eigentliche Gespräch ­gehen.


Der Vorteil gegenüber konventionellen Fragebögen ist, dass die Patient:innen sich mit dem KI-Assistenten ganz normal unterhalten können. Nedoszytko hatte ein Beispiel: Wenn der Patient auf die Frage nach der derzeitigen Medikation sagt, dass seine Frau die Medikationsliste habe, dann hakt der Chatbot sofort nach: Er möge doch bitte mal seine Ehefrau fragen. 


Nicht alles Gold, was glänzt

Solche Anamnese-Tools können im Einsatz sehr eindrucksvoll sein, allerdings bedeutet der Siegeszug von KI hier wie anderswo nicht, dass medizinische Expertise weniger gefragt wäre. Prof. Dr. Marc Leon von der Abteilung Herz-Thorax-Chirurgie an der Stanford Medical School stellte in Berlin ein Forschungsprojekt vor, das auf einer klinischen Beobachtung fußte. Leon hatte nämlich bemerkt, dass die Assistent:innen in seiner Klinik immer häufiger kommerzielle LLMs bei klinischen Fragestellungen zurate ziehen. Auch in Deutschland ist das mittlerweile gang und gäbe.


Leon hat sich deswegen sein Fachgebiet, die Herzchirurgie, diesbezüglich etwas genauer angesehen. Er hat fünf LLMs – DeepSeek-R1, GPT-4, Llama-3-OpenBioLLM-70B, o1 und o3-mini-high – auf insgesamt 15 klinische Szenarien angesetzt, in denen typische herzchirurgische Entscheidungen anstanden. Diese klinischen Szenarien wurden von einem Panel von drei erfahrenen Herzchirurg:innen entwickelt. Fünf weitere Herzchirurg:innen waren dann dafür zuständig, in den 15 Szenarien das herzchirurgische „Goldstandardvorgehen“ zu definieren.


Neuere Modelle sind besser
Insgesamt zeigte sich dabei, dass die neueren KI-Modelle deutlich besser abschnitten als die etwas älteren Modelle. Der Sieger war das neue Open­AI-Modell o1, gefolgt von dessen Geschwister o3-mini-high. Platz 3 ging an DeepSeek-R1 aus China, erst dann kam GPT-4. Das Open-Source-LLM Llama-3-OpenBioLLM-70B landete auf dem letzten Platz – obwohl es eigentlich spezifisch für biomedizinische Fragestellungen entwickelt wurde. Einen richtigen Gewinner sieht Leon allerdings ohnehin nicht, denn das Gesamtergebnis war aus Sicht des Kardiochirurgen alles andere als erfreulich: „Die getesteten LLMs sind nicht bereit für einen sicheren Einsatz in der Herzchirurgie“, so das Fazit des Experten.


Im Detail zeigte sich, dass alle Modelle in der Domäne „Verstehen“ gut abschnitten. Die Modelle kapierten also das klinische Szenario, und sie gaben entsprechende sinnvolle, inhaltlich passende Antworten. Diese allerdings stimmten längst nicht immer mit dem überein, was die Expert:innen für die jeweiligen klinischen Szenarien vorschlugen. „Vor allem bei komplexeren Fällen, bei denen Entscheidungen in mehreren Stufen getroffen werden mussten, hatten die Modelle Schwierigkeiten“, so Leon.


KI-Modelle sind oft zu forsch
Besonders eindrucksvoll war das bei „Szenario 14“, bei dem es darum ging, bei einem Patienten, der eine mitrale Annuloplastie benötigte – also einen operativen Eingriff an der Mitralklappe des Herzens – die richtige Größe des Klappenrings auszuwählen. Das ist nicht trivial: Zu kleine Ringe bremsen den Blutfluss aus und können die Blutdrücke im Herzen und den beiden Kreisläufen ungünstig beeinflussen, zu große Ringe verzerren die natürliche Herzanatomie. Für eine informierte Entscheidung müssen unterschiedliche Echo-Parameter, aber auch die individuelle Herzanatomie, berücksichtigt werden und es müssen einige einfache Berechnungen durchgeführt werden. 


Die nötigen Informationen lagen den KI-Modellen allesamt vor. Dennoch schlugen die fünf LLMs Mitralring-Durchmesser zwischen 28 mm und 32 mm vor. Das Experten-Panel empfahl demgegenüber 36 mm – ein erheblicher und klinisch hoch relevanter Unterschied. Durchweg Schwierigkeiten hätten die KI-Modelle auch damit gehabt, die Patientensicherheit beziehnungsweise individuelle Risiken korrekt einzuschätzen, so Leon: „Die Modelle neigten zur Übertherapie.“ Auch das ist etwas, das man in einem herzchirurgischen Setting eher nicht haben möchte. 

 

AUTOR

Philipp Grätzel von Grätz, Chefredakteur E-HEALTH-COM