Fast im Wochenrhythmus gibt es derzeit Berichte über neue Algorithmen, die Maschinenlernen für die radiologische Bildbefundung nutzen. Am jüngsten Beispiel faszinieren die Geschwindigkeit und die Haltung des medizinischen Establishments.
Wie entwickelt man Algorithmen für den medizinischen Einsatz, und wie lässt sich sicherstellen, dass die Qualität am Ende stimmt? Ein aktuelles Beispiel aus den USA liefert eine beeindruckende Blaupause. Es geht um die Entwicklung eines Algorithmus für die digitale Auswertung von Thorax-Übersichtsaufnahmen.
IT-gestützte Pneumoniediagnostik innerhalb von vier Wochen
Der Reihe nach: Am 26. September 2017 veröffentlichte der Clinical Center der Gesundheitsbehörde National Institutes of Health (NIH) in den USA einen Datensatz aus 112.120 Thoraxübersichtsaufnahmen. Die Bilder waren zuvor von radiologischen Experten unterschiedlicher Einrichtungen im Hinblick auf 14 Lungenpathologien annotiert worden. Es handelte sich also um einen im Hinblick auf 14 der häufigsten auf Thorax-Aufnahmen erkennbaren Erkrankungen vollständig durchbefundeten, qualitätsgesicherten Standarddatensatz. Die Bitte des NIH an IT-Entwickler überall im Land lautete, man möge einen Algorithmus entwickeln und ihn mit Hilfe der Bildbibliothek so trainieren, dass er klinisch nutzbar wird.
KI-Experten der Universität Stanford waren die ersten, die sich der Aufgabe annahmen. Sie arbeiteten mit einem neuronalen Netz aus 121 Schichten, also einem relativ komplexen System. Trotzdem brauchten sie nach eigenen Angaben nur eine Woche, um bei 10 der 14 Pathologien besser zu sein als die bisher bekannten und in der Literatur beschriebenen Algorithmen für die digitale Auswertung von Röntgen-Thorax-Bildern. Nach vier Wochen schlugen sie alle bekannten Algorithmen bei allen 14 Pathologien. Nicht einmal zwei Monate nach Veröffentlichung des NIH-Datensatzes publizierten die Stanforder ihre Ergebnisse jetzt auf dem Preprint-Seerver arXiv publiziert.
Kann sich irgendjemand vorstellen, dass im deutschen Gesundheitswesen ein derartiger Prozess in dieser Geschwindigkeit stattfinden könnte? Es ging übrigens noch weiter. Die Entwickler haben ihren Algorithmus nicht nur gegen andere Algorithmen, sondern auch gegen leibhaftige Radiologen antreten lassen. Und in der Indikation Pneumonie, ohne Zweifel die relevanteste Sofortdiagnose auf Röntgen-Thorax-Aufnahmen, schlug die Software gleich vier Radiologen der Universität Stanford.
Ärzte sollten Datensätze zur Verfügung stellen
Der Vorsitzende der Expertengruppe „Intelligente Gesundheitsnetze“ des Digital-Gipfels der Bundesregierung, Professor Klaus Juffernbruch von der Hochschule für Ökonomie und Management FOM in Neuss, forderte bei der jüngsten „Kontroversen Mittagspause“, die die Kassenärztliche Bundesvereinigung in Berlin organisiert hatte, dass sich die deutsche Ärzteschaft stärker engagieren müsse, um zu verhindern, dass das deutsche Gesundheitssystem im Bereich der intelligenten Algorithmen den Anschluss verliert.
Konkret schlug er vor, das aus den Reihen geeigneter Ärzteorganisationen oder anderer Einrichtungen des Gesundheitswesens umfassend annotierte Standarddatensätze in ausreichender Größe zur Verfügung gestellt werden. Dies würde es IT-Entwickler erlauben, ihre Lösungen anhand qualitätsgesicherter Daten zu entwickeln, und es würde dem deutschen Gesundheitswesen erlauben, mitzubestimmen, wohin die Reise bei der algorithmengestützten Medizin geht.
Originalpublikation bei arXiv: https://arxiv.org/abs/1711.05225
Text: Philipp Grätzel von Grätz, Chefredakteur E-HEALTH-COM