Die Schlagzeilen sind eindeutig: «Big Data, Big Problems» titelte die renommierte und nicht eben als innovationsfeindlich bekannte Wirtschaftszeitung «The Wall Street Journal » vor ein paar Monaten. Eine noch deutlichere Schlagzeile wählte kurz darauf das Schweizer Wirtschaftsmagazin «Bilanz»: «Die Big-Data-Lüge». Die Journalisten sahen sich im kultigen Newsletter von «CB Insights» bestätigt. Das Marktforschungsinstitut hatte analysiert, wie oft Start-ups die Begriffe «Big Data» und «Artificial Intelligence » in Telefonkonferenzen mit Investoren verwendeten. Das Resultat: Ab Mitte 2016 löste «Artificial Intelligence» «Big Data» als dominierenden Begriff ab und ist mittlerweile mehr als dreimal so oft das Gesprächsthema.
Die Euphorie für Big Data hat sich abgekühlt seit jenen Tagen vor etwas mehr als zehn Jahren, als das Magazin «Wired» verkündete, diese Technologie werde die herkömmliche Forschung überflüssig machen. «Wired», die publizistische Instanz im Silicon Valley, schrieb, Theorien und Hypothesen seien fortan nicht mehr nötig, Computer fänden die Zusammenhänge nun ganz von alleine. 2011 prophezeite McKinsey & Company, dank Big Data könne der öffentliche Sektor in Europa jährlich EUR 250 Milliarden sparen, mehr als das Bruttoinlandprodukt von Griechenland. Fünf Jahre später überprüfte erkannte, dass gerade einmal 10, maximal 20 % dieses Potenzials realisiert wurden. Was stimmt nun? Macht Big Data die Welt zu einem besseren, effizienteren, erkenntnisreicheren Ort? Oder ist es am Ende die neue Technologie, die überflüssig ist, und nicht wie prophezeit die herkömmliche Forschung?
Missverständnis Nr. 1: Big Data heisst viele Daten
Die Schwierigkeiten beginnen bei der Definition: Was Big Data eigentlich ist, bleibt vage. Dan Ariely, ein renommierter Psychologieprofessor mit Spezialgebiet Irrationalität, zog in einem viel beachteten Tweet Parallelen zum intimen Liebesleben von Teenagern: «Jeder spricht darüber, niemand weiss wirklich, wie es geht.» Zudem denke jeder, alle anderen würden es tun, «deshalb behauptet jeder, es selbst auch zu tun».
Die gängige Definition umfasst vier Begriffe, die auf Englisch alle mit V beginnen: Volume meint, dass es sich um sehr grosse Datenmengen handelt. Velocity bezieht sich auf die hohe Geschwindigkeit, mit der die Daten anfallen und verarbeitet werden. Variety bezeichnet die Tatsache, dass die Daten ganz unterschiedlicher Natur sein können, von einfachen Tweets zu komplexen Verkehrsdaten, und Veracity (auf Deutsch: Aufrichtigkeit) weist darauf hin, dass die Qualität der Daten stimmen muss.
Missverständnis Nr. 2: Computer sind intelligent
Computer sind für ganz viele Aufgaben perfekt geeignet, für andere wiederum aber einfach zu wenig weit entwickelt. Sie seien noch immer «bemerkenswert dumm», sagt beispielsweise John Giannandrea, der ehemalige Chef der Abteilung für künstliche Intelligenz bei Google, der diese Funktion jetzt bei Apple ausübt. Er vergleicht den Entwicklungsstand von Computern mit dem «eines vierjährigen Kindes». Wer einen Smart Speaker von Apple, Amazon oder Google benutzt, weiss, was Giannandrea meint. Eine Untersuchung ergab, dass diese Systeme zwar fast alle Fragen verstehen, aber nur bei circa drei von vier Antworten richtigliegen.