Maschinenlernalgorithmen werden aktuell auf nahezu jeden Datensatz losgelassen, der sich finden lässt. Besonders eifrig sind die Kardiologen. Neben der Universität Stanford tut sich hier die Mayo Clinic in Rochester hervor, die einige interessante Publikationen vorgelegt haben und jetzt mit einer hochrangigen Veröffentlichung in der Fachzeitschrift Lancet nachlegen.
Konkret ging es den US-Amerikanern um die Frage, ob es möglich ist, anhand eines EKGs mit scheinbar normalem Sinusrhythmus zu erkennen, ob der Patient auf absehbare Zeit Vorhofflimmern entwickeln wird. Dazu haben die Wissenschaftler alle Patienten analysiert, die seit 1994 an der Mayo Clinic kardiologisch versorgt wurden und bei denen ein 12-Kanal-EKG aufgezeichnet wurde, das einen Sinusrhythmus zeigte. Das waren insgesamt rund 180000 Patienten mit 650000 normalen EKGs. Jeder zwölfte dieser Patienten entwickelte im Verlauf ein Vorhofflimmern, das durch ein anderes, späteres EKG in der Patientenakte dokumentiert war.
Chancen vertan
Lässt sich das vorhersehen? Ein auf Google TensorFlow basierender Algorithmus wurde anhand von 126000 Patienten trainiert. Der Rest der Patienten bildete die Validierungs- und die eigentliche Testkohorte. Tatsächlich gelang es am Ende, mit einer Sensitivität und Spezifität von je rund 80 Prozent Patienten zu erkennen, die innerhalb von 31 Tagen Vorhofflimmern entwickeln. Die These ist, dass strukturelle und/oder elektrophysiologische Veränderungen auf Vorhofebene dazu führen, dass sich die P-Welle des EKG, also die Vorhofwelle, dezent verändert, was der Algorithmus möglicherweise erkennt.
Die Studie wurde in der Presse ziemlich hochgejazzt, was auch mit dem Medium zusammenhängen dürfte, in dem veröffentlicht wurde. Lancet? Muss ja gut sein. Tatsächlich hätte die Studie mehr leisten können, als sie tut. Kaum ein Medium vergisst zu erwähnen, dass „niemand“ sagen könne, anhand welcher Kriterien die KI entscheide. Blackbox und so. Tatsächlich hätte man sich mehr Mühe geben können, und zwar auch ohne komplexe Explainable-AI-Ansätze. Beispielsweise hätte die Wissenschaftler das EKG splitten und die Trainingssessions mit gesplitteten EKGs wiederholen können. Damit ließe sich unaufwändig klären, ob die Vorhofwelle den Unterschied macht.
Spannende Perspektiven
Ein weiterer Kritikpunkt an dieser Studie, den die Wissenschaftler selbst erwähnen, ist das Studienkollektiv. Patienten, die in einer kardiologischen Klinik ein 12-Kanal-EKG bekommen, sind nicht die breite Bevölkerung. Auf Bevölkerungsebene ist die Vorhofflimmerprävalenz geringer, und die Trefferquote des Algorithmus damit vermutlich schlechter.
Das ist deswegen relevant, weil diese Trefferquote ohnehin nicht besonders gut ist. 80 Prozent Sensitivität und Spezifität bedeuten schon bei einem Kollektiv wie dem Mayo-Kollektiv mit hoher Flimmerprävalenz, dass allenfalls einer von drei bis vier „identifizierten“ Patienten tatsächlich Vorhofflimmern entwickelt. So gut müsste ein Kardiologe aus dem Bauch heraus eigentlich auch sein.
Trotzdem bietet die Studie interessante Perspektiven. Ein Standard-EKG-Screening könnte beispielsweise dazu beitragen, Patienten zu identifizieren, bei denen es sich lohnt, mit Pflaster-EKGs oder invasiven Loop-Rekordern gezielter nach Vorhofflimmern zu suchen. Das würde klinisch Sinn machen, ob es kosteneffektiv ist, ist die andere Frage.
Weitere Informationen:
Die Studie im Original https://www.thelancet.com/journals/lancet/article/PIIS0140-6736(19)31721-0/fulltext