Googles "Datenschutzinitiative" und die EU-Überwachungspläne sind das Thema dieses Standpunkt Sicherheit
Google anonymisiert seine Logfiles früher
Jedenfalls ein bisschen und ein paar: Statt wie bisher nach 18 Monaten, werden Logfiles für Suchanfragen jetzt schon nach 9 Monaten anonymisiert, wie einem offenen Brief zu entnehmen ist. Jedenfalls etwas, denn es werden nur einige Bits der IP-Adressen geändert. Aha. Ein Schelm, wer böses dabei denkt? Ich denke gar nichts böses - ich frage mich, warum die die IP-Adressen der Suchanfragen überhaupt speichern. Klar, die einfachste Antwort wäre: "Das ist Google, die speichern alles, was sie unter die Finger bekommen" (auch die Abwässer aus den eigenen Bürogebäuden?). Aber selbst Google speichert wohl nichts einfach nur so - die wollen damit letzten Endes mehr Geld einnehmen, als sie die Speicherung kostet, Jedenfalls sofern sie wirtschaftlich denken, und davon sollte man einfach mal ausgehen.
Warum speichert Google die IP-Adresse der Suchanfragen?
Die Begründungen bzw. Ausreden für die Speicherung liefert Google im offenen Brief gleich mit. Wie regelmäßige Leser dieser Kolumne schon bemerkt haben werden, nehme ich so etwas immer gerne auseinander. Also, los gehts:
Argument 1: Verbesserung der Suchqualität
"Making search better in Catalonia, Estonia, and everywhere else" überschreibt Google einen Blogeintrag. Demnach werden Informationen über den Kontext einer Suche benötigt, um ein möglichst optimales Ergebnis zu liefern. Klar, Kontextinformationen sind immer nützlich, keine Frage. Dagegen ist auch nichts einzuwenden. Und Google liefert mit Sicherheit um so bessere Ergebnisse, je mehr Informationen über die verwendete Sprache vorhanden sind. Nur: Wozu braucht man dafür die IP-Adresse? Wie im Blogbeitrag zu lesen ist, werden die Benutzer über Cookies erkannt. Woher die Anfragen kommen, kann man zum einen anhand der verwendeten lokalen Google-Version erkennen - und eben an der IP-Adresse. Aber wozu muss man die dann speichern? Um ein Modell der Sprache aufzubauen, reicht es vollkommen aus, die Suchanfragen den einzelnen Sprachen zuzuordnen. Danach kann man die IP-Adresse getrost löschen. Und ich möchte wetten, für den Aufbau der Sprachmodelle macht Google auch genau das: Die Anfragen werden Sprachen oder Sprachgruppen zugeordnet und damit wird dann gearbeitet. Wieso sollte man dafür die IP-Adressen verwenden, die dann erst wieder nach Herkunftsländern aufgelöst werden müssen? Also: Zur Verbesserung der Suchqualität braucht man die IP-Adressen nicht, das lässt sich einfacher und vor allem auch Datenschutzfreundlicher lösen.
Argument 2: Erhöhen der Sicherheit
"Using log data to help keep you safe" nennt sich der Blogeintrag, aus dem ich gleich mal einen Satz zitieren muss:
While the Internet on the whole is a safe place, and most of us will never fall victim to an attack, there are more than a few threats out there, and we do everything we can to help you stay a step ahead of them.
"Das Internet im Ganzen ist ein sicherer Platz". Na, das sehen manche aber ganz anders, z.B. auch unser Bundesinnenminister, der es voller islamistischer Terroristen sieht. Aber Google gehört ja zu den Guten, und bestimmt gilt für die auch der eBay-Grundsatz, dem zu Folge ja alle Menschen gut sind. Aber genug gelästert, kommen wir zum Kern der Aussagen im Eintrag:
We analyze logs for anomalies or other clues that might suggest malware or phishing attacks in our search results, attacks on our products and services, and other threats to our users.
Im Fall der Suchmaschine betrifft das ja wohl die Schädlinge, die Google zur Suche neuer Opfer verwenden und die Google durch das (zumindest zeitweise) Blockieren dieser Abfragen aussperrt. Wozu man dafür die IP-Adressen (die ein Angreifer meist sowieso verschleiert) 9 Monate lang speichern muss, wüsste ich nicht. Angriff erkannt, Angriff gebannt, die zugehörige IP-Adresse ggf. speichern (falls Strafverfolger die haben möchten), fertig. Die IP-Adressen aller anderen, harmlosen Suchanfragen kann man getrost löschen. Wenn man ganz sicher gehen möchte, erst nach einer relativ kurzen Wartezeit. 9 Monate sind da deutlich übertrieben. Vor allem, da ein Großteil aller Suchanfragen von dynamisch vergebenen IP-Adressen kommen dürfte, und die lassen sich nach 9 Monaten sowieso nicht mehr zum jeweiligen Benutzer zurück verfolgen. Ach ja: Google verwendet die Logfiles auch, um ihre Schädlings-Filter zu testen, bevor sie aktiv eingesetzt werden. Dafür braucht man aber auch keine IP-Adressen, dafür reichen die reinen Suchanfragen.
Argument 3: Missbrauch bekämpfen
Der dazu gehörende Blogeintrag nennt sich "Using data to help prevent fraud", und wie bei den vorhergehenden gibt es meines Erachtens keinen einzigen Grund, die IP-Adressen der Suchanfragen zu speichern. Man möchte Adklick-Betrug bekämpfen, das ist sicher ein legitimes Ziel. Nur: Was hat das mit den Suchanfragen zu tun? "IP addresses of computers clicking on ads are very useful data points." Das glaube ich Google sofort, ich würde die auch protokollieren, wenn ich Betrug erkennen wollte. Aber die IP-Adressen der Suchanfragen werden dafür ganz bestimmt nicht benötigt.
Argument 4: Webspam bekämpfen
"Using data to fight webspam" heißt der letzte Blogeintrag mit Ausreden für die Speicherung der IP-Adressen. Erst mal: Hat irgendwer von Google mal bei Google nach einem Produkt gesucht, weil er z.B. Erfahrungsberichte oder eine Anleitung dafür haben wollte? Nur mit dem Produktnamen liefert das dann 1001 indirekte Links zu eBay. Besonders effektiv scheint die Spam-Bekämpfung also nicht zu sein. Wird ein neuer Filter erstellt, wird er anhand gespeicherter Suchanfragen getestet. Fein. Nur: Wozu braucht man dafür die IP-Adressen der Suchanfragen? Mir fällt dazu nur eine Antwort ein: Gar nicht.
Setzen, durchgefallen!
Alle von Google vorgebrachten Begründungen für die Speicherung der IP-Adressen sind für die Suchanfragen nichts als unbrauchbare Ausreden. Wenn Google zu den Guten gehören will - warum spioniert Google dann seinen Benutzern hinterher? Nur nicht gespeicherte Daten sind sichere Daten, und wer nicht benötigte Daten speichert, muss sich die Frage nach seinem Motiv gefallen lassen. Und wenn er dann keinen guten Grund nennen kann, darf man ja wohl an der Lauterkeit des Motivs zweifeln, oder?
Google ist heute, ...
Google ist ein heute akutes Problem, das man aber mit etwas Mühe umgehen kann. Google Analytics ist auf JavaScript angewiesen, werden die entsprechende Skripte nicht geladen bzw. nicht ausgeführt, bleibt Google außen vor. Für die Suchmaschine gibt es Alternativen, außerdem kann man die Erstellung eines Profils durch Google durch das Verwenden zusätzlicher, nicht relevanter Suchanfragen erschweren. Dazu dient z.B. die Firefox-Erweiterung TrackMeNot. So, wie manche Zeitungskäufer ihre Zeit in eine Bild-Zeitung wickeln oder den Playboy mit dem Focus tarnen, so tarnt TrackMeNot eine Suchanfrage durch das Senden weiterer Suchanfragen zu anderen Themen. Das lässt sich natürlich auch manuell machen.
... die EU ist morgen
Google kann man also entgehen - der EU nicht. Und gegen das, was da geplant wird, ist Google ein ganz kleines Licht. Nicht weniger als die totale Überwachung wird da geplant, wie man bei Statewatch nachlesen kann: Alle Datenbanken werden zum Ausschnüffeln durch die Sicherheitsbehörden freigegeben. Komisch, immer, wenn ich was von der EU höre, ist es etwas, was mir gar nicht gefällt. Und dann beklagen sich die Politiker, das die EU so einen schlechten Ruf hat?
Carsten Eilers



