Geben Sie Ihren Benutzernamen und Ihr Passwort ein, um sich an der Website anzumelden
An der Abteilung Allgemeinmedizin der Universität Göttingen haben Wissenschaftler mit Hilfe verschiedener Text Mining-Werkzeuge versucht, eingehende Anfragen bei einer medizinischen Webseite für Laien zu kategorisieren, um auf diese Weise die Bearbeitung zu beschleunigen. 988 Anfragen an die Webseite „Rund ums Baby“ wurden ausgewählt, die sich alle um das Thema unfreiwillige Kinderlosigkeit drehten.
Die Anfragen wurden manuell 38 verschiedenen Kategorien zugeordnet, darunter IVF, Spermienanalyse, Eisprung, Schwangerschaftstest und Zyklus. Für die automatische Kategorisierung wurden dagegen Indikatorvariablen auf Basis einer Chi-Quadrat-Analyse generiert. Als weitere Text-Mining-Strategien kamen die Principle Component Analysis und die Singular Value Decomposition zum Einsatz.
Auf diese Weise wurde eine relativ hohe Treffsicherheit für die automatische Kategorisierung der Anfragen erreicht. Für 18 der 38 Kategorien lagen die beiden als Qualitätsmerkmale ausgewählten Parameter „Precision“ und „Recall“ bei jeweils 100 Prozent. Für 35 der 38 Kategorien waren beide Parameter größer als 80 Prozent. Die Autoren folgern, dass unstrukturierte Anfragen von Laien zu medizinischen Themen mit Hilfe von modernem Text Mining prinzipiell sinnvoll vorsortiert werden können.
Wolfgang Himmel, Journal of Medical Internet Research 2009; 11(3):e25; open access