Brauchen wir hochbegabte Politiker?
Wie bringt man Tilman Prüfers 4-jährige Tochter, den wichtigsten deutschen Forschungspreis, den Koalitionsvertrag der GroKo und David Kahneman zusammen in einem Blog-Beitrag unter, schafft dann noch einen Bezug zu Ostern und bringt die eigene Ehefrau ins Spiel? Diese kleine Fingerübung in “seltsamen Assoziationen” – es wird Zeit für den Autor, seinem Motto bei Twitter gerecht zu werden – ist Gegenstand diese Beitrags.
Beginnen wir mit dem Einfachen: Ich schreibe diesen Artikel an Ostern und wurde dazu von meiner Frau inspiriert, als sie mir beim Frühstück aus der Osterausgabe des Zeitmagazins vorlas:
“Ich habe in meinem Bekanntenkreis mehrere Beispiele von Elternpaaren, die befürchten, ihre Kinder könnten hochbegabt sein. […] Ich höre übrigens nie, dass Eltern sich erleichtert darüber äußern, dass ihre Kinder nicht hochbegabt sind.” 1
Ich wäre erleichtert, wenn wir tatsächlich mehr hochbegabte Menschen hätten, die ihren Sachverstand an der richtigen Stelle zum Wohl der Menschheit einsetzen. Über einen, Bernhard Schölkopf, berichtet2 Philipp Mausshardt, als er herausfindet, dass seinem Freund der Gottfried Wilhelm Leibniz-Preis der Akademie der Wissenschaften verliehen wird. Bernhard Schölkopf ist Mathematiker und beschäftigt sich mit maschinellem Lernen: “Künstliche Intelligenz versucht Modelle zu entwickeln von Ursache und Wirkung.” Er will “Systeme intelligenter machen, damit sie keine falschen Schlüsse ziehen. Robuster gegen Fehler.”
Robustheit gegen Denkfehler
Die wäre auch den Politikern der GroKo zu wünschen. Die haben sich in ihrem Koalitionsvertrag laut ZEIT 3 gerade vorgenommen, die DNA-Analyse “im Strafverfahren auf äußere Merkmale (Haar, Augen, Hautfarbe) sowie Alter” auszuweiten. Klingt harmlos, ist es aber nicht, wie Dirk Asendorpf nachweist. Um das Fach Statistik bzw. Wahrscheinlichkeitsrechnung habe ich mich früher möglichst herumgedrückt. Spätestens aber, als ich Daniel Kahneman4 gelesen habe, wurde mir klar, wie schnell man gravierende Denkfehler macht, wenn man unkritisch seiner Intuition (“Schnelles Denken”) folgt – dieser Artikel ist folgerichtig eine Übung im “langsamen Denken”.
Was bedeutet das für die DNA-Analyse von äußeren Merkmalen? Laut Asendorpf lässt sich “die Hautfarbe mit 95-prozentiger Wahrscheinlichkeit aus einer guten DNA-Spur ableiten”. D.h. wenn ich eine DNA-Spur habe, kann ich daraus bestimmen, ob derjenige, der die DNA-Spur hinterlassen hat, eine helle oder dunkle Hautfarbe hat. Ich begehe dabei in 5% der Fälle eine Fehlattribution. Diese Fehlerquote hört sich zunächst nicht hoch an, aber es stellt sich anders dar, wenn man in absoluten Anzahlen und bezogen auf eine konkrete Population rechnet. Und schließlich kann diese, nur vermeintlich hohe, “Genauigkeit” dazu führen, dass fäschlicherweise eine Minderheit von Menschen unter Generalverdacht gestellt wird.
Daniel Kahneman (2012) erklärt es auf Seite 202 am Beispiel einer Zeugenaussage vor Gericht: “Dies ist ein Standardproblem der Bayesschen Inferenz. Es gibt zwei Informationselemente: eine Basisrate und die nicht gänzlich zuverlässige Aussage eines Zeugen.” Die Basisraten sind im Artikel von Asendorpf durch die Bevölkerungsanteile der Menschen mit hellen bzw. dunklem Hauttyp gegeben, die “nicht gänzlich zuverlässige Aussage eines Zeugen” findet ihren Gegenpart in der Genauigkeit (95%) der DNA-Analyse.
Gedankenexperiment: Äußeres Merkmal “Politiker”
Machen wir ein Gedankenexperiment und nehmen an, es lasse sich mit 95-prozentiger Genauigkeit mittels einer DNA-Analyse einer am Tatort hinterlassenen DNA-Spur als “äußeres Merkmal” erkennen, ob der Täter ein Politiker ist oder ein (normaler) Bürger.
Zur Vereinfachung der Rechnung benutze ich gerundete Zahlen: Deutschland hat ca. 80 Mio Einwohner. Über die Anzahl der Berufspolitiker habe ich keine Statistik gefunden, daher helfe ich mir mit einer groben Abschätzung nach oben: 2016 hatten alle Parteien zusammen (CDU, SPD, CSU, FDP, Grüne, Linke, AfD) ca. 1.208.000 Mitglieder 5; mit der Annahme, dass nicht mehr als jeder Vierte der Mitglieder ein Berufspolitiker bzw. Politiker ist, der irgendein öffentliches Amt bekleidet, kommt man auf max. ca. 300.000 Politiker. Kurz und gut: Von den ca. 80.000.000 Einwohnern in Deutschland sind etwa 300.000 Politiker und 79.700.000 normale Bürger.
99,625% der Einwohner Deutschlands sind normale Bürger und 0,375% Politiker.
Wenn ich als Ermittler an einen Tatort gerufen werde, dann weiß ich, ohne noch irgendetwas anderes zu wissen, die Wahrscheinlichkeit P(p), dass die Tat von einem Politiker begangen wurde, beträgt 0,375% und die Wahrscheinlichkeit P(b) für eine Täterschaft eines ganz normalen Bürgers 99,625%. Diese sind die jeweiligen Basisraten für die Merkmale Politiker und Bürger in der Population Deutschland.
Schauen wir uns als Nächstes die Extreme an, dann wird schnell deutlich, warum der Bevölkerungsanteil (= Basisrate) eine entscheidende Rolle bei der Interpretation der Ergebnisse einer DNA-Analyse spielt, aus der äußere Merkmale eines Verdächtigen abgeleitet werden sollen.
1. Fall: Alle Einwohner sind normale Bürger
Nehmen wir von all diesen Menschen jeweils eine DNA-Probe und analysieren diese, dann wird in 4.000.000 Fällen fälschlicherweise trotzdem “Politiker” als Ergebnis der DNA-Analyse herauskommen. Wird eine DNA-Spur gefunden, die auf einen Politiker als Täter hindeutet, dann ist die Wahrscheinlichkeit P(p), dass sie tatsächlich zu einem Politiker gehört bei dieser Population gleich 0%.
2. Fall: Alle Einwohner sind Politiker
Das gleiche Ergebnis wie im Fall 1, nur umgekehrt. Wird eine DNA-Spur gefunden, die auf einen Politiker hinweist, dann ist die Wahrscheinlichkeit P(p), dass sie zu tatsächlich zu einem Politiker gehört, gleich 100%. In diesem Fall sind alle Analysen, die als Ergebnis “Bürger” ergeben, fehlerhaft.
3. Fall: Die Hälfte sind normale Bürger, andere Hälfte Politiker
Wieder ergibt die DNA-Analyse das äußere Merkmal “Politiker” als Ergebnis. Wie groß ist nun die Wahrscheinlichkeit, dass sie tatsächlich zu einem Politiker gehört?
- Von 40.000.000 Politikern werden 95% richtig erkannt: p1 = 38.000.000
- Von 40.000.000 Politikern werden 5% fälschlicherweise als Bürger bestimmt: b2 = 2.000.000
- Von 40.000.000 Bürgern werden 95% richtig erkannt: b1 = 38.000.000
- Von 40.000.000 Bürgern werden 5% fälschlicherweise als Politiker bestimmt: p2 = 2.000.000
Die Wahrscheinlichkeit P(p|Tp), dass eine als “Politiker” analysierte DNA-Probe tatsächlich zu einem Politiker gehört, berechnet sich dann als Quotient aus der Anzahl der Politiker, die bei einer DNA-Analyse tatsächlich als solche erkannt werden (p1) und der Summe der insgesamt durch die Analyse als Politiker bestimmten Personen (p1 + p2):
P(p|Tp) = p1 / (p1 + p2) = 38.000.000 / (38.000.000 + 2.000.000) = 38.000.000 / 40.000.000 = 95%
Nur in diesem Fall der gleichen Verteilung von Politikern und Normalbürgern in der Bevölkerung, kann man in jedem Fall mit 95% Sicherheit nach der DNA-Analyse sagen, wessen Geistes Kind derjenige ist, von dem die Probe stammt. Das hilft bei der Verbrechensaufklärung wenig, es bleiben immer noch 50% der Gesamtbevölkerung als Verdächtige übrig.
4. Fall: Die oben geschätzte Verteilung von 99,625% Bürger und 0,375% Politiker
Ich möchte die Verhältnisse anhand eines Baumdiagramms verdeutlichen:
Demnach gilt im Einzelnen:
- Von 300.000 Politikern werden 95% richtig erkannt: p1 = 285.000
- Bei 300.000 Politikern werden 5% fälschlicherweise als Bürger analysiert: b2 = 15.000
- Von 79.700.000 Bürgern werden 95% richtig erkannt: b1 = 75.715.000
- Bei 79.700.000 Bürgern wird 5% fehlerhaft auf Politiker getippt: p2 = 3.985.000
P(p|Tp) = p1 / (p1 + p2) = 285.000 / (285.000 + 3.985.000) = 6,7% 6
Wenn ich eine DNA-Spur finde und bei der DNA-Analyse ergibt sich mit einer Genauigkeit von 95%, dass es sich beim Täter um einen Politiker handelt, dann beträgt die tatsächliche Wahrscheinlichkeit, dass der Täter ein Politiker ist, nur 6,7%. Das ist eine völlig nutzlose “Erkenntnis”, daraus kann man auf gar nichts schließen. Trotzdem male man sich aus, wie die Nachricht, dass die DNA-Analyse einen Politiker als Täter ergeben habe, in der Öffentlichkeit rezipiert würde.
Für den umgekehrten Fall (die DNA-Analyse deutet auf einen normalen Bürger hin) errechnet man übrigens die Wahrscheinlichkeit, dass ein Normalbürger die Spur hinterließ, zu P(b|Tb) = 75.715.000 / (75.715.000 + 15.000) = 99,98%. Diese Wahrscheinlichkeit grenzt an Sicherheit, nützt aber einem Ermittler nichts, wenn er damit nur einen verschwindend kleinen Anteil an der Bevölkerung als Täter ausschließen kann.
Und was bedeutet das nun?
Je kleiner eine Minderheit im Verhältnis zur Mehrheit einer Population ist, um so größer ist die Gefahr für die Minderheit, durch die DNA-Analyse einem ungerechtfertigten und diskriminierenden Verdacht ausgesetzt zu werden.
Warum fordert dann überhaupt jemand diese Ausweitung der DNA-Analyse auf äußere Merkmale von Menschen? Entweder enthält man Ergebnisse, die nicht aussagekräftig und nicht belastbar sind, dafür aber eine Minderheit diskriminieren, oder die Ergebnisse sind relevant, nützen den Ermittlern aber nichts, weil sie den Täterkreis nicht signifikant eingrenzen.
Auf der reinen Sachebene bleibt es für mich unverständlich. Mögliche Motive, die Politiker, Parteien und Strafverfolger dazu bringen, trotzdem diese Erweiterung der DNA-Analyse für Strafverfahren anzustreben, und die bisherige Diskussion finden sich an diversen Stellen 7 8.
Mehr hochbegabte Politiker?!
Warum ich mich frage, ob wir mehr hochbegabte Politiker brauchen, sollte klar geworden sein. Aber natürlich wäre das nur die halbe Miete. Selbst Politiker, die diese Zusammenhänge verstehen – ich bin sicher: sie gibt es – haben das Problem, diese ihren Wählern verständlich zu machen, damit sie wiedergewählt werden. Dies erscheint allerdings in einer Zeit, in der die Bezeichnung “Traditionshase” (statt “Osterhase”) auf einem Kassenbon sogleich als Indiz oder gar Beweis für eine Islamisierung Deutschlands genommen wird, eine fast unerfüllbare Voraussetzung zu sein.
Mit Verweis auf die Digitalisierung fordern viele, dass alle Schüler eine Programmiersprache als “erste Fremdsprache” lernen. Ich glaube, das reicht nicht. Wesentlich erscheint mir darüber hinaus folgendes:
- Schüler benötigen Basiskenntnisse bezüglich der Analyse und Interpretation von Daten und Informationen: Gerade im Zeitalter von Big Data, Künstlicher Intelligenz und maschinellem Lernen muss jedem klar sein, dass Daten nicht neutral, auf ihnen basierende Schlussfolgerungen und Informationen interpretionsbedürftig sind und kritisch hinterfragt werden müssen.
- Eine Schulung in systemischem Denken ist wichtig, um Schülern die Chance zu geben, sich aus der Sklaverei des Denkens in einfachen und linearen Ursache-Wirkungs-Beziehungen zu befreien.
Wenn Wünschen helfen würde
Wenn hinter jedem, der leichtfertig mit der Genauigkeit einer bestimmte Methode oder Erkenntnis argumentiert, ein Springteufel aus einem Kasten spränge, dem Sprecher mit einem Stock auf den Kopf schlüge, um seine Aufmerksamkeit zu erheischen, und ihn dann anschrie:
Hast Du auch an die Basisraten gedacht, Dummkopf?!
Und erst wenn der Betroffene dies glaubwürdig nachgewiesen hätte, würde der Springteufel wieder mitsamt seinem Kasten verschwinden, denn er hat noch viel zu tun. – Was meinen Sie: Würde das etwas bewirken?
Bernhard Schölkopf, um auf einen offensichtlich Hochbegabten zurückzukommen (zumindest ehemals Hochbegabten, in der Gegenwart darf man ihm attestieren, etwas aus seiner mathematischen Begabung gemacht zu haben) brauchte den Basisraten-Teufel nicht zu fürchten: Die Bayessche Mathematik gehört zu den Grundlagen eines Datenwissenschaftlers. Bei ihm klingt auch der verbreitete Schlachtruf “Daten sind das neue Öl!” nüchtern und nachvollziehbar: “Die Information hat Energie als Paradigma abgelöst.” Und die verbreitete Sichtweise auf den industriellen und technischen Fortschritt teilt er nicht: “Wir befinden uns mitten in der dritten industriellen Revolution. Nach der mechanischen und der elektrischen folgt jetzt die kybernetische Revolution.” sagt er; eindeutig kein Mainstream-Bewusstsein, denn wo bleibt da Industrie 4.0?
Einzelne brillante Wissenschaftler werden nicht reichen
Wenn unsere Gesellschaft – wir – und die Politiker, die wir uns leisten, es nicht schaffen, ein der Realität und den heutigen wie zukünftigen Herausforderungen adäquates Denken zu entwickeln, wird es schwer. Auch das Abwälzen von Entscheidungen auf “intelligente” digitale Systeme (#KI #AI #MachineLearning) wird nicht helfen: solange wir unsere eigenen kognitiven Verzerrungen und Defizite bei der Bewertung von Daten und Informationen nicht in den Griff bekommen, werden wir es schaffen, sie auch intelligenten Systemen zu implantieren. Und diese werden dann, sehr viel effizienter als wir Menschen das je könnten, unermüdlich und hoch skalierbar Fehlentscheidungen am laufenden Band treffen und effektiv umsetzen.
Maschinen sind unbeeindruckbar. Ich fürchte, da wird dann auch kein “passiver Widerstand als höchste Form des zivilen Ungehorsams” helfen (dessen Beherrschung durch seine 4-jährige Tochter Tilman Prüfer zur Befürchtung veranlasst, sie sei hochbegabt), wenn uns die dabei angerichteten kollateralen Schäden nicht gefallen.
Im Zweifelsfall gehört übrigens jeder einzelne von uns zu einer Minderheit, die durch äußere Merkmale identifiziert werden kann. – Es kommt nur auf die Kriterien an.
So weit für jetzt.
-
Prüfer, T. (2018, 28. März). Prüfers Töchter - Ich kann alles. Zeitmagazin, S. 45. ↩
-
Mausshardt, P. (2018, 22. März). Und? Was machst du so? DIE ZEIT, S. 39. ↩
-
Asendorpf, D. (2018, 22. März). Phantom im Wattestäbchen. DIE ZEIT, S. 42. ↩
-
Kahneman, D. (2012). Schnelles Denken, langsames Denken. München, Deutschland: Siedler Verlag. ↩
-
Niedermayer, O. (2017). Parteimitglieder in Deutschland: Version 2017 NEU [PDF-Dokument]. Abgerufen 31. März, 2018, von polsoz.fu-berlin.de/polwiss/forschung/systeme/empsoz/schriften/Arbeitshefte/P-PMIT17-NEU.pdf ↩
-
Der Vollständigkeit halber hier noch die auf die konkrete Fragestellung angewendete Formulierung des Satzes von Bayes:
P(p|Tp) = P(Tp|p) P(p) / (P(Tp|p) P(p) + P(Tp|b) P(b)) = 95% x 0,375% / (95% x 0,375% + 5% x 99,625%) = 6,675%
mit
P(p|Tp): Wahrscheinlichkeit, dass Probe von Politiker, wenn Ergebnis = “Politiker”
P(p): Anteil der Politiker an der Bevölkerung (= 0,375%)
P(b): Anteil der Bürger an der Bevölkerung (= 99,625%)
P(Tp|p): Wahrscheinlichkeit, dass Ergebnis = “Politiker”, wenn Probe von Politiker (95%)
P(Tp|b): Wahrscheinlichkeit, dass Ergebnis = “Politiker”, wenn Probe von Bürger (5%)
↩ -
Geuther, G., & Kazmierczak, L. (2017, 20. Juni). Erweiterte DNA-Analyse - Den Tätern auf der Spur. Abgerufen 3. April, 2018, von deutschlandfunk.de/erweiterte-dna-analyse-den-taetern-auf-der-spur.724.de.html ↩
-
See, C. von. (2017, 25. November). DNA-Analysen - Augenfarbe, Alter und Herkunft per DNA-Probe herausfinden. Abgerufen 3. April, 2018, von rnz.de/wissen/wissenschaft-regional_artikel,-dna-analysen-augenfarbe-alter-und-herkunft-per-dna-probe-herausfinden-_arid,318971.html ↩
(16.879 Zeichen)