"Die Gesellschaft muss das richtige Gleichgewicht zwischen Datenaustausch und Datenschutz finden"
Der Datenschutz muss öffentlich und offen diskutiert werden, sagt Christian S. Jensen, Präsident der Leitungsgruppe von NFP 75 "Big Data".
Wie erklären Sie sich, dass Big Data momentan für so viel Wirbel in den Medien und der Wirtschaft sorgt?
Da kommen zwei Entwicklungen zusammen. Erstens ist die Menge der vorhandenen Daten explodiert: Experten schätzen, dass 90% aller Daten in den letzten zwei Jahren erfasst wurden. So etwas hat es noch nie gegeben. Zweitens verfügen wir über Computer und Kommunikationsinfrastrukturen mit nie gehabter Leistung. Daraus entstehen neue Möglichkeiten, Daten für soziale und geschäftliche Zwecke auszunützen. Big Data befasst sich mit grundlegenden technischen Fragen, die sich auf Anwendungen in verschiedenen Bereichen übertragen lassen.
Was bedeutet Big Data für Sie persönlich?
Ich gehöre zur Database Systems Research Community. Seit Jahrzehnten bemühen wir uns, die Grenzen der Datenmengen, die wir verarbeiten können, zu erweitern. Es freut mich, dass sich heute so viele Leute für unsere Forschung interessieren, aber manchmal ist es auch etwas überwältigend.
Wo erwarten Sie die grössten Nutzen?
Es ist immer schwierig, Prognosen zu machen. Wenn wir aber schauen, wo die meisten Daten erfasst werden, so kann man einige Bereiche herausheben: digitalisiertes Sozialleben, online und reales Einkaufen, E-Government, sowie Industrie, Logistik, Banken- und Versicherungswesen, Transport und Medizin.
Gibt es Bereiche, die für Big Data tabu sein sollen?
Es ist schwierig, Bereiche zu identifizieren, in denen Daten nicht zur Schaffung von Mehrwert eingesetzt werden können. Aber Anwendungen sind nur dann erfolgreich, wenn sie von der Zielgruppe auch begrüsst werden. Es ist keine gute Idee, unerwünschte Technologien einzuführen.Riesige Herausforderungen stellen sich im Bereich der Eigentumsrechte und der Verwaltung der Daten. Auch der gefahrenfreie Austausch von Daten ist eine Herausforderung. Es ist eine Tatsache, dass Daten wertvoll sind und ihr Wert mit zunehmender Verbreitung steigt. Es stellen sich deshalb wichtige Fragen wie: Wie müsste ein Datenmarkt aussehen? Müssen wir Daten schützen, zum Beispiel mit einem Patent wie es zum Schutz von geistigem Eigentum geschieht? Die Gesellschaft muss das richtige Gleichgewicht zwischen Datenaustausch und Datenschutz finden.
Der Datenschutz ist ein wichtiges Anliegen der Bevölkerung. Es besteht die Gefahr, dass sich die öffentliche Meinung gegen Big Data wendet. Sind sich die Forschenden dessen bewusst?
Im Rahmen des NFP 75 sehe ich da keine grosse Gefahr. Es ist unwahrscheinlich, dass Anwendungen entwickelt werden, die Daten von vielen Nutzern verwenden. Wenn man aber mit sehr grossen Datenmengen arbeitet, besteht tatsächlich ein beträchtliches Risiko. Es ist deshalb wirklich wichtig, dass eine öffentliche Debatte stattfindet und die Bevölkerung gut informiert ist. Wir müssen über unser demokratisches System Einfluss ausüben; dabei müssen die Medien eine wichtige Rolle spielen und die Anwendung dieser Technologie hinterfragen. Das ist von grösster Wichtigkeit.
Prinzipiell sollten Daten anonymisiert sein. Oft besteht aber die Möglichkeit, diesen Prozess rückgängig zu machen und Daten zu de-anonymisieren.
Ja, in einigen viel beachteten Fällen konnten Forschende Daten de-anonymisieren, die zuvor für einen offenen Wettbewerb freigegeben wurden. Das ist möglich, indem man die Daten mit anderen Quellen vergleicht. Das ist ein offenkundiges Problem. Man muss eine Balance zwischen Datenaustausch und diesem Problem finden. Die GPS-Daten eines Autos können die Verkehrssteuerung massgeblich erleichtern - aber gleichzeitig können sie ausgenutzt werden, um das Verhalten einer Lenkerin oder eines Lenkers unter die Lupe zu nehmen... Indem wir vom schlimmstmöglichen Fall ausgehen, können wir diese Herausforderung diskutieren.
Glauben Sie, dass die Bevölkerung nach Snowden und der NSA-Affäre noch bereit ist, für bessere Dienstleistungen Daten zur Verfügung zu stellen?
Vor allem bei jüngeren Leuten scheint die Akzeptanz für Eingriffe in die Privatsphäre tendenziell zu steigen. Das bereitet mir Sorgen, und eine öffentliche Auseinandersetzung ist dringend nötig. Es wäre ideal, wenn die Leute die Kontrolle über ihre eigenen Daten hätten und bestimmen könnten, wer sie verwenden darf. So wüssten sie, wie ihre Daten eingesetzt werden und könnten sie auch wieder löschen. Wenn Entscheidungen aufgrund meiner Daten getroffen werden, will ich überprüfen können, ob sie korrekt sind. Das Löschen von Daten und eine digitale Präsenz sollten möglich sein.
Fühlen Sie sich als Forscher dafür verantwortlich, wie Ihre Arbeit verwendet wird?
Ich bin in erster Linie Techniker. Die Anwendung ist nicht mein Gebiet. Wir stellen die Technik, die wir entwickeln, zur Verfügung, aber sie kann halt auch missbraucht werden - darauf habe ich keinen Einfluss. Da müssen wir uns darauf verlassen, dass die Politik die entsprechenden Gesetze erlässt.
Die meisten Daten sind nicht im Besitz von Staat und Forschung, sondern von privaten Firmen. Ist das ein Problem?
Ja, aus der Perspektive der Forschenden ist das problematisch. Daten sind wertvoll; Firmen stellen sie nicht gratis zur Verfügung. Wir müssen sie überzeugen, mit uns zusammenzuarbeiten.
Welche technischen und konzeptionellen Herausforderungen erwarten Forschende im Bereich Big Data?
Das hängt ganz von der Anwendung ab, aber alle sind vom Problem der riesigen Datenmengen betroffen und von der Geschwindigkeit, in der neue Daten erfasst werden. Auch ist es schwierig, aus heterogenen und manchmal falschen Quellen Informationen zu extrahieren. Man muss abschätzen, ob Quellen kombiniert werden können und ob die Daten von guter Qualität sind, was nicht einfach ist.
Daten sind Gold wert - besteht das Risiko, dass die Erwartungen zu hoch sind?
Wenn wir einen Lebensbereich quantitativ erfassen wollen, richtet sich meistens unsere ganze Aufmerksamkeit auf diesen Bereich. So wird es möglich, dass wir uns verbessern: Ein Schrittzähler kann dazu motivieren, mehr zu gehen. Gleichzeitig vernachlässigen wir aber andere Lebensbereiche, weil unsere Aufmerksamkeit nicht mehr darauf gerichtet ist. Die Daten, die schwierig zu erfassen sind, sind vielleicht genauso wichtig, wie die erfassten Daten. Wir können sicherlich von Studien profitieren, die sich kritisch mit unserer datenzentrierten Einstellung auseinandersetzen. Das ist ein wichtiger Gesichtspunkt.
Maschinelle Lernverfahren analysieren Daten sehr effizient, aber es ist uns nicht möglich, die Resultate nachzuvollziehen - es ist wie eine Black Box, über die wir nur beschränkte Kontrolle haben. Ist das ein Problem?
Das ist eine spannende Herausforderung. Manche Leute glauben, dass man auch ohne Hypothesen Informationen aus Daten extrahieren kann; das geschieht manchmal im Bereich Data-Mining. Doch das wird intensiv diskutiert. Eine allgemeingültige Antwort gibt es sicher nicht. Letztlich muss man einzelne Anwendungen genau anschauen. Aber grundsätzlich finde ich auch, dass ein Resultat nicht sehr nützlich ist, wenn ich nicht verstehe, wie es erzielt wurde.
Wo steht Ihrer Meinung nach die Schweiz in den Bereichen Forschung und Anwendung von Big Data?
Die Position der Schweiz ist in beiden Bereichen ausgezeichnet: Die Bevölkerung ist gut ausgebildet, die Infrastruktur und der Wirtschaftsplatz sind hervorragend.
Seit dem Fichenskandal von 1989 hat die Schweizer Bevölkerung eine starke Ablehnung gegen die Erhebung von Daten.
Wie gesagt, es ist meiner Ansicht nach äusserst wichtig, dass wir eine Debatte über den Datenschutz führen. Aber Datenschutz ist nicht in allen Bereichen relevant. So zum Beispiel in der personalisierten Medizin: Sie geht davon aus, dass alle Patienten anders sind und deshalb auf andere Behandlungen ansprechen - Datenschutz ist da nicht immer ein Thema. Ein anderer Bereich ist die weitverbreitete Schweinemast in Dänemark: durch ein Screening der geschlachteten Schweine wird es möglich, dass Roboter die Tiere zerlegen. Das erleichtert eine repetitive Arbeit und senkt Kosten. Sensible Daten sind hier nicht im Spiel.
Es gibt Forschende, die das NFP 75 kritisiert haben, weil es die Naturwissenschaften auf Kosten der Sozialwissenschaften bevorzuge.
Die Hälfte der Leitungsgruppe ist nicht in den Naturwissenschaften zu Hause: zu den Mitgliedern zählt ein Ökonom, ein Jurist und eine Spezialistin für Digital Humanities. Ich finde, die Balance stimmt. Es ist wichtig, dass verschiedene Perspektiven wie Naturwissenschaften, Ingenieurwissenschaften, Anwendungen und Sozialwissenschaften vertreten sind. Um von Big Data profitieren zu können, müssen wir die Verwendung von Daten optimieren und gleichzeitig potenzielle Probleme erkennen und lösen. Es gibt jedoch einen Unterschied bei der Höhe der Forschungsgelder: Forschung, die sich mit dem Erwerb und der Analyse von Daten auseinandersetzt, ist oft arbeitsintensiv und erfordert eine experimentelle Infrastruktur. Sie ist deshalb oft kostenintensiv.
Sie sind Informatiker. Haben Sie das Gefühl, Sie können ein Forschungsgesuch aus den Sozialwissenschaften beurteilen?
Alle Projektgesuche werde von Fachleuten aus dem entsprechenden Fachgebiet gemäss ihrer eigenen Kriterien evaluiert. Die Ausschreibung ist ziemlich offen und wir können jederzeit zusätzliche Expertinnen oder Experten beiziehen, wenn ein Gebiet viele Gesuche verzeichnet.
Christian S. Jensen
Christian S. Jensen ist Professor am Department of Computer Science an der Universität Aalborg in Dänemark. In seiner Forschung befasst er sich mit dem Management von räumlich-zeitlichen Daten inklusive Modelling, Datenbankdesign und Indexing. Zuvor arbeitete er an den Universitäten von Aarhus, Arizona und Maryland sowie am Hauptsitz von Google in Mountain View, Kalifornien. Er präsidiert die Leitungsgruppe des NFP 75 "Big Data".