Das menschliche Urteil – Der entscheidende Wertschöpfer bei KI

Workshop

Voraussagen spielen eine bedeutende Rolle, wenn es darum geht, Entscheidungen zu treffen. Eine weitere Zutat ist dazu unabdingbar und wichtig, welche die KI-Gemeinschaft bisher allzu oft unterschätzt oder gar nicht beachtet hat und die ihm aktuellen Hype auch wieder zum allergrößten Teil untergeht: Bewertung oder Beurteilung. Voraussagen erleichtern Entscheidungen weil sie Unsicherheiten verringern. Beurteilung dagegen bedeutet echten Wert beziehungsweise Wertschöpfung. Ökonomisch ausgedrückt ist Beurteilung die Fähigkeit, Kostenverhältnisse, Nutzen, Einnahmen und Gewinne zu beziffern. Eine der wichtigsten Effekte von Voraussagen und Künstlicher Intelligenz ist, dass sie den Wert von Urteilsfähigkeit drastisch steigern.

Sinnvoll – oder nicht?

Denn nicht immer sind die Muster, die Maschinen und Algorithmen erkennen oder die Werte, die autonome Systeme errechnen auch wirklich sinnvoll, wenn man vom Ziel her denkt. Genau das können Menschen und treffen so (hoffentlich) ihre Entscheidungen. Maschinen können das nicht. Deswegen versuchen Wissenschaftler und Praktiker ja auch so krampfhaft, ihnen das beizubringen. Ein Beispiel: Bereits in den 1980er Jahren programmierten Fachleute ein selbstlernendes Schachprogramm. Mit überraschendem Ergebnis. Der Maschine wurden unzählige Datenbestände aus den Partien von Schachgroßmeistern eingetrichtert, mit dem Ziel, dass die Maschine lernen oder herausfinden sollte, welche Spielmuster erfolgreich wären und welche nicht. Anfangs sah alles auch ganz gut aus. Die Berechnungen der Maschine zu Stellungen der Schachfiguren auf dem Feld waren exakter und schneller, als alles was man bisher bei solchen Programmen kannte. Das Problem tauchte auf, als es ans wirklich Spielen ging. Das Programm errechnete die optimale Strategie aufgrund der analysierten Datenmengen, begann mit Angriffsszügen und opferte sehr schnell die eigene Dame. Danach verlor die Maschine die Partei nach ein paar Zügen, es hatte die Dame für nichts und wieder nichts mehr oder weniger sofort geopfert. Wieso das? Nun, ganz einfach. Meistens opferten menschliche Schachmeister ihre Dame vor einem genialen und unerwarteten Spielzug, mit dem sie dann das Spiel gewinnen konnten. Für die Maschine war also das Muster klar und völlig eindeutig nach der Analyse der Daten: Opfere Deine Dame, das ist der Weg zum Sieg. Naja… Vielleicht nicht ganz. Dieses Beispiel macht klar, dass akkurate Berechnungen und das Erkennen von Mustern kaum etwas wert ist oder sogar enormen Schaden anrichten kann, wenn es keine menschliche Bewertung und Beurteilung der Ergebnisse vor dem Hintergrund des eigentlichen Ziels und des jeweiligen Kontextes gibt. Das ist gemeint, wenn wir konstatieren, dass gerade durch die Nutzung und den Einsatz hochleistungsfähiger Systeme und Netze, die menschliche Urteilsfähigkeit zum großen Wertschöpfungsfaktor wird. Oder eben zur wichtigen Sicherung gegen finanzielle, physische oder psychische Schäden, die aus akkuraten aber sinnlosen Berechnungen und „Erkenntnissen“ von Künstlichen Intelligenzen resultieren können.

Dazu ein weiteres Beispiel. Während des zweiten Weltkriegs beauftragte die US Air Force den Statistiker Abraham Wald damit, die Daten von beim Einsatz abgeschossenen und zurückgekehrten Flugzeugen auszuwerten. Ziel sollte sein, abzuleiten wo und wie die Flugzeuge besser gegen feindliches Feuer geschützt werden könnten. Das Ergebnis der Datenanalyse erschien zunächst paradox und unverständlich. Wald empfahl, die Flugzeuge an den Stellen zu verstärken an denen keine Einschusslöcher festzustellen waren. War das nicht falsch? Sollte man nicht besser die Stellen schützen, auf die sich das Feuer konzentrierte und die oft getroffen wurden? Nein. Denn die reine Datenanalyse – hier die Erfassung von Treffern und daraus erkannte Muster – gab nicht auch bereits die richtige Antwort. Auch hier kam es darauf an, den Kontext zu verstehen und die Daten vor dem Hintergrund des gesamten Geschehens zu bewerten. Die Daten (Treffer) stammten von Flugzeugen, die getroffen worden waren, es aber wieder nach Hause schafften. Also schienen die Treffen an den Stellen nicht so fatal zu sein. Diejenigen Flugzeuge, die es eben nicht wieder nach Hause schafften, mussten also an anderen Stellen getroffen worden sein, die für Flugzeug wie Mannschaft tödlich waren. Die Air Force verstärkte wirklich die Flugzeuge an den von Wald empfohlenen Stellen. Und die Flugzeuge waren auf ihren Einsätzen tatsächlich deutlich besser geschützt. Die entscheidende Lösung kam also von einem Menschen, mit dem notwendigen technischen und statistischen Verständnis und der geistigen und intellektuellen Flexibilität, das Problem auch aus anderen Perspektiven sehen zu können und so die richtige Lösung zu finden. Diese Kompetenzen sind entscheidend in der Arbeit und Kooperation mit allen Arten Künstlicher Intelligenz. Fehlen diese Kompetenzen, glauben Menschen in Unternehmen zu leicht und vertrauensvoll, die Ergebnisse von Maschine würden schon von alleine vorgeben, welcher Weg zu gehen sei. Aber genau das kann in die falsche Richtung führen, weil beispielsweise Ursache und Wirkung oder Korrelationen und Kausalitäten vermischt oder falsch interpretiert werden.

Mensch und Maschine sind gemeinsam (fast) unfehlbar

Gerade in der Verbindung von Fähigkeiten und Vorteilen von Maschinen und Menschen liegt die große Chance der fünften Stufe von Wirtschaft und Gesellschaft. 2016 entwickelten Forscher aus Harvard und vom Massachusetts Institute of Technology einen Deep-Learning Algorithmus zur Erkennung von Krebsmetastasen der eine Korrektheit bei der Diagnose von 92,5 Prozent erreichte. Die gleiche Quote liegt bei entsprechend ausgebildeten Fachärzten (Pathologen) bei 96,6 Prozent. Erstaunlich war das Ergebnis bei der Kombination aus Algorithmus und menschlicher Beurteilung. Das Team aus Mensch und Maschine erreichte eine Korrektheit bei der Diagnose von 99,5 Prozent. Das heißt, dass die menschliche Fehlerrate bei Diagnosen von 3,4 Prozent auf 0,5 Prozent gesenkt werden konnte; insgesamt betrachtet wurde die Fehlerrate um 85 Prozent verringert. Betrachtet man diese Verbesserungen vor dem Hintergrund der Vielzahl von Diagnosen auf der Welt, sind das enorme Fortschritte. Übertragen wir dies auf Wirtschaft und Unternehmen und die Diagnosen, Analysen und Entscheidungen, die hier täglich getroffen werden (müssen), dann können wir erahnen, was für ein Potenzial in der richtigen Verbindung der Stärken von Mensch und Maschine im ökonomischen Sinne noch darauf wartet, gehoben zu werden.