taz.de/1/!5656025 - Gopher HTTP proxy

# taz.de -- Erinnerung und Vergessen im Netz: Ausgrabungen im digitalen Raum

> Unmengen an Daten werden produziert, gespeichert – und vergessen. Wird
> das alles archiviert? Ein Blick auf künftige Archäologie.

IMG Bild: Vergangenes wird unscharf und unvollständig, auch im Netz

Wer sich im Internet als Hobbyhistoriker betätigen will, der kann mit einem
Mausklick das [1][Internet Archive] konsultieren. Die
Non-Profit-Organisation hat auf ihren Servern 396 Milliarden Webseiten
archiviert. Man findet dort zum Beispiel die Online-Ausgabe der New York
Times vom 11. September 2001 oder einen Snapshot von Spiegel Online aus dem
Jahr 1997, das an das Web 1.0 und die Anfangszeiten der Homepage-Bastler
erinnert. Das Netzgedächtnis, das in einer ehemaligen Kirche in San
Francisco lagert, ist mehr als nur ein Privatarchiv, es ist auch ein Stück
Kultur- und Computergeschichte, das die Entwicklungen der Technologie auf
eindrückliche Weise dokumentiert – wenn auch nur bruchstückhaft.

Doch jedes Archiv, jede Bibliothek (wenn es nicht gerade die totale
Bibliothek von Babel mit unendlich vielen Büchern und Zeichen ist, wie
sie der argentinische Schriftsteller Jorge Luis Borges imaginierte) ist
selektiv: Sie kann schon allein aufgrund des begrenzten Raums nur eine
limitierte Anzahl von Büchern und Schriften archivieren, und bei einer
digitalen Bibliothek ist es aufgrund der begrenzten Speicherkapazitäten der
Rechner nicht anders.

Die Frage ist, ob die Archivierung beziehungsweise Konservierung von
Sinneinheiten in Zeiten digitaler Bilder- und Informationsflut überhaupt
sinnvoll erscheint. Pro Minute werden allein auf Facebook eine halbe
Million Kommentare gepostet, auf YouTube 500 Stunden Videomaterial
hochgeladen. Wer soll das alles aufbewahren? Und warum? Die International
Data Corporation (IDC) prognostiziert, dass das Datenvolumen bis 2025 auf
175 Zettabyte anschwellen wird. Gewiss, Daten sind nicht gleich
Informationen. Doch schon heute ist es schwierig, die Informationen im Netz
zu strukturieren.

Der Webanalyst JJ Rosen geht davon aus, dass der Google-Index lediglich 4
Prozent der Informationen aus dem Netz repräsentiert. Laut einer Studie der
Fachzeitschrift Nature hat Google rund 16 Prozent der Web-Oberfläche
indexiert. Die tieferen Schichten des World Wide Web, das sogenannte Deep
Web, hat der Suchmaschinenriese mit seinen Fangnetzen, den sogenannten
Webcrawlern, noch nicht durchdrungen.

## Kurze Halbwertszeit

Das Deep Web ist ein riesiger Ozean aus Informationen: Datenbanken,
Statistiken, Archive, Geheimdienstdokumente, Facebook-Posts – all das kann
über Google nicht gefunden werden. Es ist ein wenig so, als würde man mit
einem Boot auf offenem Meer in den ersten zwei bis drei Metern unter der
Wasseroberfläche fischen. Doch bis in die Tiefen des Meeres dringt man
nicht vor.

Vint Cerf, „Chief Internet Evangelist“ bei Google und einer der „Väter“ des
Internets, [2][warnte vor einigen Jahren vor einem „digitalen Dark Age“]:
Künftige Generationen könnten unter einer Art digitalen Amnesie leiden,
weil alte Formate nicht mehr lesbar seien. „Was über die Zeit passieren
kann, ist, dass, selbst wenn wir große Archive mit digitalen Inhalten
anlegen, wir möglicherweise nicht wissen, was es ist.“ Der Grund: Die
relativ kurze Halbwertszeit digitaler Speichertechnologien.

Blu-ray hat eine durchschnittliche Lebensdauer von 50 bis 100 Jahren
(abhängig von Wärme, Licht, Feuchtigkeit und Kratzer), bei USB-Sticks liegt
sie bei 30 Jahren (wobei die Schreibzyklen begrenzt sind), bei Servern
zwischen zwei bis zehn Jahren. Bedenkt man, dass Inschriften auf Steinen
(etwa der keilschriftlich überlieferte Codex Hammurapi, eine Sammlung von
Rechtssprüchen aus dem antiken Mesopotamien) Jahrtausende überdauert haben,
nimmt sich das als relativ kurze Periode aus.

Angenommen, man schreibt das Jahr 2100 und googelt nach einem Begriff
(sofern die Suchmaschine bis dahin überhaupt noch existiert): Würde man
eine Seite finden, die anno 2019 indexiert wurde? Man kann diese
Überlegungen zu folgendem Gedankenexperiment verdichten: Angenommen, es
gäbe Ende des Jahrhunderts die Profession des Internetarchäologen, der mit
digitalen Werkzeugen die untersten Schichten des World Wide Web freilegt.

Was würde er sehen? Kopien von Selfies? Hasskommentare? Digitalen Müll?
Gelänge es ihm, den Code freizuschaufeln, jenen Baustoff elektronischer
Dörfer, der den Alltag von Millionen Menschen strukturiert? Was würden
Internetarchäologen über den Google- oder Facebook-Algorithmus
herausfinden? Und wäre es nicht auch eine Pflicht der Entwickler, diese
Black-Box-Systeme zu archivieren und der Nachwelt zu überliefern?

Die Entwicklerplattform Github will ihren Open-Source-Code [3][mithilfe
eines Lasers auf einer Quarzglasscheibe eingravieren] und in einem Endlager
in der norwegischen Arktis archivieren. Im Packeis sollen die Daten 10.000
Jahre überdauern. Es geht dabei ja auch um die Erinnerungskultur, um die
Frage, was eine Gesellschaft als konservierbar erachtet, was Eingang in das
Zivilisationsarchiv findet – eine Entscheidung, die man nicht Algorithmen
überantworten kann.

Das Recht auf Erinnern, das als Gegenstück zum [4][Recht auf Vergessen]
bisweilen zu kurz kommt, ist ja ein konstitutives Element der
Öffentlichkeit. Allein, wie will man sicherstellen, dass die Kopien ein
Abbild vergangener Lebenswelten zeichnen, wo schon gut erhaltene
Steinplatten nicht mehr sind als Näherungswerte an vergangene Realität mit
hoher Fehleranfälligkeit? Ist der Gedanke, Informationen zu archivieren,
nicht ein sehr analoger? Können digitale Informationen doch jederzeit
überschrieben werden. Und woher rührt die Speicherwut der digitalen
Gesellschaft, alles aufzeichnen zu wollen?

## Das Internet vergisst

Nach Michel Foucault war das Archiv „das Gesetz dessen, was gesagt werden
kann, das System, das das Erscheinen der Aussagen als einzelner Ereignisse
beherrscht“. Mit der Dekonstruktion wollte der Poststrukturalist nicht nur
die bürgerliche Institution der Bibliothek sprengen, sondern auch das
Wechselspiel zwischen der Erfassung von Aussagen und der Aussagbarkeit
aufzeigen. Für Foucault ist das Archiv eben kein statischer Speicher,
sondern ein dynamisches Aussagesystem, dem a priori bestimmte Machtcodes
eingeschrieben sind.

Überträgt man diesen Gedanken auf die digitale Welt, würde das bedeuten,
dass mit der Indexierung von Informationen bei Google – das dem
Archivierungsprozess sehr nahe kommt – Aussagen über die generelle
Aussagbarkeit von Informationen getroffen werden. Sowohl in dem Sinn, was
unsere Daten über uns aussagen, als auch in dem Sinn, welche Aussagen eine
Suche über die Wirklichkeit im Netz trifft.

Die Diagnose, dass das Problem des Internets nicht in der mangelnden
Fähigkeit des Erinnerns, sondern in der „schwindenden Möglichkeit des
Vergessens“ liege (Roberto Simanowski), wird zuweilen als Störung oder
Defekt eines speicherwütigen Mediums betrachtet. Doch das Internet hat
durchaus die Fähigkeit zum Vergessen. Im März 2019 [5][vermeldete das
soziale Netzwerk MySpace einen riesigen Datenverlust]: Im Rahmen einer
Servermigration seien Millionen Songs, Fotos und Videos, die vor 2015
auf der Seite hochgeladen worden waren, vernichtet worden. 12 Jahre,
einfach so verschwunden.

MySpace war zwischen 2005 und 2008 ein populäres soziales Netzwerk. Doch
dann kam Facebook – und damit begann der Abstieg. MySpace gilt heute als
tot, es gibt kaum noch aktive Nutzer. Doch der Datenverlust macht deutlich,
dass das Vergessen nicht gerichtlich angeordnet werden muss, sondern auch
durch technisches oder menschliches Versagen geschehen kann.

Wissen ist in der Geschichte immer wieder vernichtet, verworfen, verborgen
oder aufgegeben worden, sei es durch Brände, Bücherverbrennung oder
schlichtes Aussortieren. Der britische Historiker Peter Burke beschreibt in
seinem Buch „Die Explosion des Wissens“, wie im 18. Jahrhundert erstmals
der Gedanke aufkam, Bücher nicht deshalb zu vernichten, weil sie ketzerisch
oder subversiv waren, sondern weil sie schlicht nutzlos erschienen.
Bibliotheken sortierten immer wieder Bestände aus, um Platz für neues
Wissen zu schaffen.

## Trump-Tweets müssen aufbewahrt werden

Das gilt auch für digitale Bestände. Die Online-Enzyklopädie Wikipedia
löscht regelmäßig Artikel – das Portal „Deletionpedia“, das es sich zur
Aufgabe machte, gelöschte Artikel aufzubewahren, wurde 2009 eingestellt,
was ja auch ein Indiz für die Vergeblichkeit totaler Speicherung ist. Auch
die Library of Congress, die seit 2010 jeden Tweet archivierte und bis 2013
auf eine stattliche Sammlung von 170 Milliarden Kurznachrichten kam,
[6][hat dieses babylonische Unternehmen 2017 aufgegeben] – das Datenvolumen
war schlicht zu groß.

Einzig die Tweets von Donald Trump müssen nach Vorgabe des Presidential
Records Act of 1978 von Amts wegen aufbewahrt werden – auch die, die er
gelöscht hat. Der Rechtsakt wurde erlassen, um zu verhindern, dass die
Tonbandmitschnitte von Gesprächen mit Ex-Präsident Richard Nixon vernichtet
werden. Die Demokratie erhält sich ein langes Gedächtnis.

13 Feb 2020

## LINKS

DIR [1] https://web.archive.org/
DIR [2] https://www.bbc.com/news/science-environment-31450389
DIR [3] https://archiveprogram.github.com/
DIR [4] /Beschluss-fuer-das-Recht-auf-Vergessen/!5641007
DIR [5] /Datenverlust-bei-MySpace/!5581108
DIR [6] https://www.npr.org/sections/thetwo-way/2017/12/26/573609499/library-of-congress-will-no-longer-archive-every-tweet?t=1571827178897

## AUTOREN

DIR Adrian Lobe

## TAGS

DIR Internet
DIR Archäologie
DIR Recht auf Vergessen
DIR Google
DIR Donald Trump
DIR Schwer mehrfach normal
DIR Google
DIR Tauchen
DIR Bundesgerichtshof
DIR Schwerpunkt Meta
DIR Recht auf Vergessen
DIR Recht auf Vergessen
DIR Google

## ARTIKEL ZUM THEMA

DIR Klüger werden durch Google: Kannst du vergessen

Ich dachte, dass wir unser Gesamtwissen durch die Googelei erweitern
würden. Das Gegenteil stimmt. Wissenschaftler sprechen gar von Digitaler
Amnesie.

DIR Urteil zum Recht auf Vergessenwerden: Keine Fake News bei Google-Treffern

Die Suchmaschine muss Falschinformationen aus ihrer Ergebnisliste
entfernen. Das hat der Europäische Gerichtshof entschieden.

DIR Unterwasser-Archäologe über seinen Job: „Ein bisschen Indiana Jones“

Florian Huber ist Unterwasser-Archäologe und hat kürzlich eine Enigma
gefunden. Ein Gespräch über Geisternetze in der Ostsee und grauen Alltag.

DIR Urteil des BGH zu Suchmaschinen: Google muss nicht vergessen

Kritische Berichte muss die Suchmachine auch nach Jahren nicht auslisten,
urteilt der Bundesgerichtshof. Zumindest nicht, wenn sie stimmen.

DIR Filter bei Facebook und Microsoft: Beim Livetest versagt

Algorithmische Verfahren können mit humaner Wahrnehmung nicht mithalten –
zeigen zwei im „Guardian“ dokumentierte Fälle.

DIR Beschluss für das „Recht auf Vergessen“: Eine einleuchtende Entscheidung

Das Bundesverfassungsgericht hat entschieden: Das Internet muss auch mal
vergessen können. Aber der Beschluss birgt auch eine Gefahr.

DIR Urteil des Verfassungsgerichts: Recht auf Vergessen gestärkt

Die Verfassungsbeschwerde eines 1982 verurteilten Mörders war erfolgreich.
Sein Name muss zukünftig aus Online-Artikeln gelöscht werden.

DIR Entscheidung zur Privatsphäre im Netz: Echtes Vergessenwerden ist Illusion

Der Europäische Gerichtshof zwingt Google, bestimmte Daten von Franzosen in
der EU nicht zu zeigen. Doch globales Link-Entfernen ist keine Lösung.