Das Forschungsteam prüfte die KI-Anwendung unter realistischen klinischen Bedingungen in zwei Hautkrebszentren, der Universitätsklinik für Dermatologie der MedUni Wien und dem Sydney Melanoma Diagnostic Centre in Australien. Die prospektive Studie bestand aus zwei Szenarien, wobei die KI in Szenario A bei auf Hautkrebs verdächtigen Veränderungen eingesetzt wurde und in Szenario B bei Patient:innen mit vielen Muttermalen. Die KI-gestützte Anwendung wurde in beiden Fällen sowohl mit medizinischen Expert:innen als auch weniger erfahrenen Ärzt:innen verglichen.
In Szenario A wurden 172 verdächtige pigmentierte Läsionen (davon 84 bösartig) bei 124 Patient:innen untersucht; in Szenario B analysierte das Forschungsteam 5.696 pigmentierte Läsionen (davon 18 bösartig) bei 66 Patient:innen. Es wurden zwei verschiedene KI-gestützte Smartphone-Anwendungen verwendet: ein neuartiger 7-Klassen-KI-Algorithmus und ein bereits in retrospektiven Vorstudien verwendeter ISIC-Algorithmus. In Szenario A zeigte der 7-Klassen-KI-Algorithmus eine äquivalente diagnostische Genauigkeit im Vergleich mit den Expert:innen, während er den weniger erfahrenen Ärztinnen signifikant überlegen war. Der ISIC-Algorithmus dagegen schnitt im Vergleich zu den Expert:innen signifikant schlechter ab, jedoch besser als die unerfahrenen Anwender:innen.
KI-Entscheidungen kritisch betrachten
In Bezug auf Behandlungsentscheidungen war der 7-Klassen-Algorithmus den Expert:innen signifikant unterlegen, jedoch den unerfahrenen Anwender:innen überlegen. Die Ergebnisse deuten darauf hin, dass eine KI-gestützte Smartphone-Anwendung zur Hautkrebsdiagnose in einem realen klinischen Szenario ähnlich gute diagnostische Entscheidungen trifft wie Expert:innen. Bei Behandlungsentscheidungen dagegen waren die Expert:innen der KI überlegen. Kittler: „Die KI-Anwendung neigt in der Behandlungsempfehlung tendenziell dazu, mehr gutartige Läsionen zu entfernen, als Expert:innen das würden. Wenn man das beachtet, ist die KI-Anwendung durchaus einsetzbar. Zu bedenken ist auch, dass bei unkritischem Einsatz zuviele falsch-positive Befunde abgeklärt werden müssten.“
Service: The Lancet Digital Health
Comparison of humans versus mobile phone-powered artificial intelligence for the diagnosis and management of pigmented skin cancer in secondary care: a multicentre, prospective, diagnostic, clinical trial.
Scott W Menzies, Christoph Sinz, Michelle Menzies, Serigne N Lo, William Yolland, Johann Lingohr, Majid Razmara, Philipp Tschandl, Pascale Guitera, Richard A Scolyer, Florentina Boltz, Liliane Borik-Heil, Hsien Herbert Chan, David Chromy, David J Coker, Helena Collgros,
Maryam Eghtedari, Marina Corral Forteza, Emily Forward, Bruna Gallo, Stephanie Geisler, Matthew Gibson, Amelie Hampel, Genevieve Ho, Laura Junez, Philipp Kienzl, Arthur Martin, Fergal J Moloney, Amanda Regio Pereira, Julia Maria Ressler, Susanne Richter, Katharina Silic, Thomas Silly, Michael Skoll, Julia Tittes, Philipp Weber, Wolfgang Weninger, Doris Weiss, Ping Woo-Sampson, Catherine Zilberg, Harald Kittler.
DOI: https://doi.org/10.1016/S2589-7500(23)00130-9
Quelle: MedUni Wien