Tamara Kajtazović

1. 2. 2015  |  Družba

Koliko časa objava ostane na internetu?

Ko je nekaj enkrat na internetu, bo tam ostalo za vedno, nas pogosto strašijo. Vendar to ni povsem res. Povprečna življenjska doba spletne strani je sto dni. Obstajajo pa internetni arhivi, ki poskrbijo, da vsebina ostane arhivirana za vedno.

Kot piše Jill Lepore v The New Yorkerju, je po nesreči malezijskega letala pri ukrajinskem Donecku eden od separatističnih vodij Igor Girkin, znan tudi kot Strelkov, na svojem profilu ruskega družabnega omrežja VKontakte objavil stavek: »Ravnokar smo sestrelili letalo, AN-26.« Kratica označuje Antonov 26, vojaško tovorno letalo iz sovjetskih časov.

Strelkov je objavo že po nekaj urah izbrisal. A na njegovo nesrečo je bila ta arhivirana še pred izbrisom. Dva tedna pred omenjeno nesrečo je namreč Anatolov Šmelev, kurator zbirke o Rusiji in Evraziji pri ustanovi Hoover na Stanfordu, v neprofitno knjižnico Internet Archive vnesel ruske spletne strani in bloge, ki morajo biti zabeleženi v zbirki o ukrajinskem konfliktu. Profil Strelkova je bil identificiran kot pomemben za razumevanje ukrajinskega konflikta – »Strelkov je eden najpomembnejših oseb v konfliktu, zato mora biti njegova stran posneta dvakrat na dan,« je izbor utemeljil Šmelev.

Šmelev je eden od tisočih knjižničarjev in arhivarjev, ki identificirajo potrebne pridobitve za zbirke spletnega arhiva Internet Archive. Te so shranjene v napravi Wayback Machine v San Franciscu. Naprava je največji spletni arhiv – zbirka spletnih strani. Je robot, ki brska po internetu in vsake dva meseca naredi kopijo vsake spletne strani, na katero naleti. Arhiv je sicer napolnjen tudi s spletnimi stranmi in drugimi spletnimi vsebinami, ki jih izberejo arhivarji – strokovnjaki, kot je Anatol Šmelev, ki strani zbirajo za posamezno tematsko področje. To počnejo s storitvijo Archive.It, kjer lahko tudi posamezniki in ustanove gradijo svoje arhive, katerih kopije se shranijov v Wayback Machinu.

V Wayback Machinu, ki je edini globalni arhiv spletnih strani, je arhiviranih več kot 430 milijard spletnih strani. Večino spletnih arhivov vodijo nacionalne knjižnice, ki zbirajo tisto, kar je v njihovi domeni – spletni arhiv švedske nacionalne knjižnice na primer vključuje vse spletne strani, ki se končajo s končnico .se. Ameriška kongresna knjižnica ima arhiviranih devet milijard spletnih strani, britanska knjižnica šest milijard. Vendar so tudi te zbirke odvisne od Wayback Machina, saj jih večina uporablja odprtokodni sistem Internet Archiva Heritrix.

Internet Archive tako skrbi, da spletne strani in internetni spomin ne izginejo. Vsebine na spletu namreč ne obstanejo večno. Pred dvema letoma so britanski konzervativci izbrisali za deset let govorov torijcev, lansko leto je BuzzFeed izbrisal več kot štiri tisoč svojih zgodnjih objav. Spletna stran tudi ne rabi biti namerno izbrisana, da izgine. Strani, ki jih gostijo korporacije, so ob propadu korporacije ukinjene. Tako je na primer izginilo na milijone profilov uporabnikov spletnih strani MySpace, GeoCities in Friendster, ko so bila podjetja spremenjena ali prodana. Ko pa so enkrat kopije teh internetnih vsebin shranjene v Wayback Machinu, se izginotja vsebine ni bati. 

Izginotje spletnih strani pogosto postane problem, ko so te navedene kot reference v člankih in knjigah. Ob kliku na staro povezavo, se včasih pojavi napis »stran ne obstaja«, ali še slabše – vsebina je popolnoma drugačna, kot je bila prvotno. Ta pojav je problematičen recimo za sodišča, saj pravniki, odvetniki in sodniki pogosto navajajo spletne strani v opombah in pričakujejo, da bodo dokazi ostali na strani za vedno. A raziskava iz leta 2013 je pokazala, da po šestih letih skorajda polovica povezav v pravnih in podobnih dokumentih ni več delovala. Tudi študija harvardske pravne fakultete je potrdila, da več kot 70 odstotkov povezav znotraj zbornika Harvard Law Review in drugih zbornikov ter več kot 50 odstotkov povezav v mnenjih ameriškega vrhovnega sodišča ne vodi na prvotno citirane informacije. To seveda ne predstavlja težave samo za pravnike, pač pa tudi za znanstvenike, zdravnike in druge. Z reševanjem te zagonetke se je spopadel laboratorij za inovacije na Harvardu, razvili so orodje perma.cc, ki ustvari povezavo z arhivirano vsebino spletne strani, ki jo želi oseba navesti v svojem članku ali dokumentu.

»Internetni spomin« je torej na dobri poti, da tu ostane za vedno. In kako izgleda največja spletna knjižnica? Je veliko bolj hrupna kot običajne knjižnice, saj stolpe shranjevalnih diskov hladijo ventilatorji. Nešteto modrih lučk zasveti vsakič, ko nekje v svetu nekdo nalaga vsebine v arhiv ali pa jih išče. Šeststo tisoč ljudi vsak dan uporablja Wayback Machine, vsako sekundo poteka dva tisoč iskanj. Ko nekdo sestreljuje letalo in o tem poroča svetu, nekdo drug klikne »shrani« in vsebino arhivira v Internetu Archivu oziroma Wayback Machinu.

Pisma bralcev pošljite na naslov pisma@mladina.si. Minimalni pogoj za objavo je podpis z imenom in priimkom ter naslov. Slednji ne bo javno objavljen.