Neue Studien untersuchen, wie ein von Google entwickeltes System für die Erkennung von Brustkrebs im realen Einsatz in britischen Krankenhäusern bei der Untersuchung von Mammographien funktioniert. Obwohl dieses System bereits 2020 vorgestellt wurde, wurde es bisher nicht routinemäßig für die Diagnose von Patientinnen eingesetzt.

Die Forschungsergebnisse zeigen, dass KI in bestimmten Situationen mehr Tumore erkennen kann als ein erster menschlicher Experte und gleichzeitig die Anzahl der falsch-positiven Ergebnisse reduzieren kann.

Funktionsweise des Systems

Das Google-System verwendet drei Convolutional Neural Networks (CNNs), die auf umfangreichen Datenbanken von Mammographiebildern trainiert wurden. Diese Modelle erzeugen gemeinsam eine Bilddarstellung, identifizieren verdächtige Bereiche und bewerten anschließend die Wahrscheinlichkeit für das Vorhandensein von Krebs.

An der Entwicklung und dem Testen waren Wissenschaftler vom Imperial College London, der University of Surrey, dem Royal Surrey NHS Foundation Trust und anderen Screening-Zentren des National Health Service beteiligt.

Testergebnisse

In einer retrospektiven Studie, die 116.000 Mammographiebilder von Frauen im Alter von 50 bis 70 Jahren umfasste, erreichte das System eine Sensitivität von 0,541, während die erste menschliche Bewertung 0,437 erreichte. Das bedeutet, dass die KI mehr tatsächliche Fälle von Krebs identifizierte.

Gleichzeitig behielt das System eine hohe Spezifität von 0,943, was nur geringfügig unter dem Wert von 0,952 bei Ärzten liegt, aber statistisch vergleichbar ist.

Ein wichtiges Ergebnis war, dass das System etwa 25 % der Fälle identifizieren konnte, die ursprünglich von menschlichen Ärzten übersehen wurden, bei denen sich bei den Patientinnen später jedoch Krebs bestätigte.

In einer Simulation, bei der die KI den zweiten Gutachter bei der doppelten Beurteilung von Bildern ersetzte, zeigte sie leicht bessere Ergebnisse als ein Mensch und konnte gleichzeitig die Arbeitsbelastung der Experten um etwa 40 % reduzieren, dank einer effizienteren Fallbearbeitung.

Test im realen Einsatz

In einer weiteren Studie wurden etwa 9.250 neue Bilder von 12 britischen Kliniken aus den Jahren 2023 und 2024 analysiert. Das KI-System arbeitete parallel zur üblichen Diagnostik, beeinflusste aber keine Entscheidungen der Ärzte.

Hier zeigte sich, dass die KI deutlich schneller war: Die Auswertung eines Bildes dauerte durchschnittlich 17,7 Minuten, während die erste menschliche Bewertung mehr als zwei Tage benötigte.

Auch in diesem Test behielt das System eine höhere Sensitivität als die erste ärztliche Bewertung und eine vergleichbare Spezifität.

Vorteile und Grenzen

Die Ergebnisse bestätigen, dass KI eine wichtige Unterstützung für Gesundheitssysteme bieten kann, insbesondere dort, wo es einen Mangel an Radiologen und eine hohe Anzahl von Untersuchungen gibt.

Gleichzeitig äußerten einige Ärzte Bedenken hinsichtlich der Ergebnisse des Systems, was darauf hindeutet, dass nicht nur die technische Genauigkeit, sondern auch die Akzeptanz der Technologie in der klinischen Praxis ein entscheidendes Problem darstellt.

Hintergrund

Der Einsatz von künstlicher Intelligenz in der Mammographie baut auf Entwicklungen seit den 1990er Jahren auf, als die ersten Systeme für die computergestützte Diagnose entstanden. Ein schneller Fortschritt erfolgte erst mit dem Deep Learning in der Mitte der 2010er Jahre, als Modelle traditionelle Methoden übertrafen.

Brustkrebs betrifft jährlich etwa 2,3 Millionen Frauen weltweit, und Hunderttausende Fälle enden tödlich. Eine frühzeitige Diagnose ist daher von entscheidender Bedeutung.

deeplearning.ai/gnews.cz - GH