La storia dei tweet fantasma: ecco come il social web scompare
Ogni anno il 10% dei link postati su Twitter diventa inservibile. Ecco perché le notizie durano sempre di meno sul social web
Vi dico una cosa ovvia, lampante: l’informazione che un tempo eravamo abituati a fruire a intervalli regolari, incorniciati da una colazione in famiglia, una pausa pranzo, una finestra post-lavoro e pre-aperitivo, da qualche anno a questa parte è diventata ubiqua, incessante, travolgente. Se con il primo web era possibile accedere alle notizie in tempo reale e in qualsiasi momento della giornata, con il web 2.0 l’informazione si è frammentata in un’infinità di post, tweet, link, rovesciati a ritmo continuo in diverse modalità sul tuo schermo o display multitouch. Il flusso è così copioso che la sfida per le nuove piattaforme, è quella di trovare il modo di scremare le informazioni in modo che l’utente riceva solo le notizie che gli interessano prima che vadano perse nello scolo (che poi sarebbe il compito dei discovery engine).
Vi dico una cosa molto meno ovvia: una buona parte dell’informazione condivisa tramite social network scompare letteralmente dalla rete nel giro di pochi anni. Per la precisione, il 10% dei link condivisi su Twitter, dopo un anno riconducono a pagine vuote, scomparse. In un arco temporale di due anni e mezzo, questa percentuale sale addirittura al 27%. Non solo, nello stesso lasso di tempo, il 41% delle pagine condivise risultano archiviate sotto un diverso indirizzo web. Questo, in parole povere, significa che circa un terzo dei link che oggi stai postando su Twitter, entro i prossimi tre anni non ricondurranno più a nulla.
A scoprire questo buco nero del social web sono stati due ricercatori della Old Dominion University di Norfolk, in Viriginia. I due avevano cominciato a passare in rassegna il social web per collezionare tweet relativi ai moti della primavera araba, con l’intento di ricostruire l’architettura dei link condivisi durante quel periodo su Twitter. A ricerca iniziata, però, si sono accorti che una buona parte dei tweet postati all’epoca contenevano link fantasma che non portavano più alla notizia d’origine. Incuriositi, hanno deciso di analizzare meglio la questione prendendo in considerazione 6 diversi dataset (l’esplosione del virus H1N1, la morte di Michael Jackson, le elezioni in Iran e le relative proteste, il Nobel per la pace a Obama e la rivoluzione in Siria) relativi al periodo compreso tra il 2009 e il 2012. Il risultato è uno studio pubblicato in questi giorni, che dimostra come i link condivisi su Twitter stiano scomparendo al ritmo dello 0,02 per cento al giorno.
Non sono ancora chiare le ragioni di questa “evaporazione di link”, è probabile che gran parte dei link vada persa perché un sito o un blog è stato chiuso o spostato su un altro dominio, o perché l’articolo di riferimento è stato trasferito in un archivio a cui si può accedere solo pagando, cosa che accade con diverse testate web. In ogni caso, i dati portati alla luce dai ricercatori di Norfolk sono molto più preoccupanti di quanto possano sembrare a un primo sguardo. La tendenza illustrata nello studio è chiaramente lineare, questo vuol dire che non solo i link scompaiono, ma con il passare del tempo la percentuale di collegamenti fantasma continua a crescere. Considerando il ruolo sempre più importante che Twitter va ricoprendo nel panorama dell’informazione web (soprattutto grazie al sistema di hashtag che consente una scrematura istantanea), un simile tasso di decadimento dei link rende virtualmente impossibile effettuare ricerche cronologiche accurate per studiare la risonanza social che un determinato evento ha generato.
Quello dell’archiviazione web, è un problema che si estende ben oltre i confini di Twitter e dei social network in generale. Ogni giorno una quantità di nuovi siti appare in Rete e una quantità altrettanto importante la abbadona. Solo due anni fa, la direttrice della Biblioteca Nazionale Centrale di Firenze, Antonia Ida Fontana, segnalava la scomparsa di almeno 1 milione di siti web ogni anno. Per questo motivo, esistono iniziative volte ad archiviare la Rete nella sua complessità, pagina per pagina, con l’obbiettivo ultimo di conservare ogni singolo frammento di Web prima che scompaia nel nulla.
L’iniziativa più importante, in questo senso, è Internet Archive , che da fine anni ’90 “fotografa” periodicamente l’aspetto e l’architettura di tutti i siti esistenti, così da archiviarne una copia nei suoi server (a proposito, chi ha voglia di fare un salto sulla homepage di Wikipedia del 2003 ?). Mentre i siti più frequentati vengono però fotografati più spesso, quelli meno frequentati vengono rispolverati raramente, il risultato è che in questi intervalli una buona fetta del web finisce per andare persa senza lasciare traccia.
Per quanto riguarda l’archiviazione dei contenuti di Twitter (e di Facebook) il problema è ancor più complicato , dal momento che nessuno di questi social network consente (per ora) di scaricare liberamente l’intero archivio dei post condivisi e i loro motori di ricerca faticano a spulciare materiale più vecchio di un paio di mesi.
Intanto che questo problema attende soluzione, nel panorama hi-tech grandi e piccole compagnie si scervellano alla ricerca del motore di ricerca definitivo. C’è chi punta sulla social search, chi mette tutte le fiches sui discovery engine, c’è anche chi, come Google, si è messo in testa di trasformare il proprio motore in un mostro di rilevanza capace di trovarti quello che cerchi prima ancora che tu, effettivamente, abbia deciso di cercarlo. In tutto questo, si perde di vista il fatto che spesso e volentieri strumenti di questo tipo si rivelano utilissimi a scandagliare l’immediato presente, ma faticano a orientarsi nel labirinto di contenuti passati che, la ricerca di Norfolk lo dimostra, hanno una data di scadenza molto più corta di quanto ci saremmo mai aspettati.
Il rischio è che fra qualche anno avremo a disposizione strumenti formidabili per cercare con una precisione al picometro qualcosa che nel frattempo, magari, non esiste più.
Seguimi su Twitter: @FazDeotto