Das Künstliche Intelligenz (KI)-Modell GPT-4, bekannt durch seine Anwendung in ChatGPT, zeigt beeindruckende Fähigkeiten in der biomedizinischen Forschung und kann vielseitig für Simulationen eingesetzt werden. Ein an der MedUni Wien entwickelter und auf GPT-4 basierender Simulator zeigt eine erhöhte Genauigkeit bei der Klassifikation der Wichtigkeit von Genen in Krebszellen sowie bei der Prognose von Krebspatient:innen. Die Ergebnisse der Studie wurden im Journal Computers in Biology and Medicine veröffentlicht.
Große Sprachmodelle wie GPT-4 haben sich in verschiedenen Bereichen als äußerst nützlich erwiesen, so auch in der Biomedizin. Ein Forschungsteam des Instituts für Künstliche Intelligenz der MedUni Wien und des CeMM Forschungszentrum für Molekulare Medizin unter der Leitung von Matthias Samwald und Christoph Bock hat gezeigt, dass ein großes Sprachmodell wie GPT-4 effektiv als Simulator für biologische Systeme eingesetzt werden kann. Die Studie testet die Hypothese, dass die schrittweise Simulation biologischer und medizinischer Prozesse mit GPT-4 zu besseren Ergebnissen führt. Dies ist sowohl für die zukünftige Anwendung in der biomedizinischen Forschung als auch für das Verständnis dieser neuen Modelle relevant.
Computersimulationen biologischer Prozesse sind ein wichtiges Instrument für die biomedizinische Forschung, erfordern jedoch in der Regel viel Fachwissen und manuelle Anpassungen. Das Forschungsteam hat „SimulateGPT“ entwickelt, eine wissensbasierte Simulationsmethode durch strukturierte Eingaben in GPT-4. Diese Methode wurde in verschiedenen Szenarien wie Mausexperimenten, Unterstützung bei der Behandlung von Sepsis, Vorhersage von essentiellen Genen in Krebszellen und progressionsfreiem Überleben von Krebspatient:innen getestet und von Expert:innen validiert. Die Methode ist für die Grundlagenforschung konzipiert und nicht für den klinischen Einsatz vorgesehen.
Strukturierte Eingaben und gezielte Anweisungen
Sprachmodelle wie GPT-4 werden durch Texteingaben, so genannte „Prompts“, gesteuert, um bestimmte Aufgaben zu erledigen oder Probleme zu lösen. Moderne Modelle wie ChatGPT/GPT-4 antworten direkt auf einfache Fragen, haben aber Schwierigkeiten, komplexere Szenarien zu lösen, wie sie in der Biomedizin häufig vorkommen. In der Studie konfigurierten die Wissenschafter:innen GPT-4 mit strukturierten Eingaben und gezielten Anweisungen so, dass es vorgegebene Szenarien detailliert mit Text simulierte.
Die Studie zeigte, dass dieser GPT-4-basierte Simulator deutlich bessere Ergebnisse erzielte. Die Experimente der Studie wiesen nach, dass biomedizinische Expert:innen die Vorhersagen von SimulateGPT gegenüber direkten GPT-4-Antworten bevorzugten. Zudem verbesserte SimulateGPT die Genauigkeit sowohl bei der Bestimmung essentieller Gene in Krebszellen als auch bei der Vorhersage der progressionsfreien Überlebenszeit von Krebspatient:innen im Vergleich zu herkömmlichen GPT-4-Antworten.
„Diese Studie zeigt, dass große Sprachmodelle (Large Language Models, LLMs) wie GPT-4 eine neue Klasse von biomedizinischen Simulatoren ermöglichen könnten“, erklärt Matthias Samwald. „Textbasierte Simulationen sind besonders geeignet, um lebende Systeme zu modellieren und zu verstehen, da Text und Sprache die Flexibilität und Interpretierbarkeit mitbringen, die notwendig sind, um die Komplexität der Biologie zu beschreiben. Für die Weiterentwicklung von LLM-basierten biomedizinischen Simulatoren schlagen wir mehrere Richtungen vor, darunter die Integration biologischer Datenbanken und mathematischer Modellierung, sowie das Training neuer KI-Modelle mit experimentellen Daten.“
Publikation: Computers in Biology and Medicine
GPT-4 as a biomedical simulator
Moritz Schaefer, Stephan Reichl, Rob ter Horst, Adele M. Nicolas, Thomas Krausgruber, Francesco Piras, Peter Stepper, Christoph Bock, Matthias Samwald
doi.org/10.1016/j.compbiomed.2024.108796
Quelle: MedUni Wien