Retroscena

Valerian e la città dei mille pianeti: uno sguardo al futuro dell'archiviazione dei dati (e un concorso)

Dominik Bärlocher
18.7.2017
Traduzione: tradotto automaticamente

Ho già visto il film "Valerian e la città dei mille pianeti". A parte lo spettacolo, una cosa in particolare mi è rimasta impressa: L'enorme archivio di dati nella città spaziale Alpha. Ecco perché ho deciso di approfondire l'argomento.

Madness.

La follia.

Il nome di Laureline è chiaramente presente nel titolo. Quasi nessuna eroina della fantascienza è così influente come lei.

Una questione di memoria elettronica

I dati sono estremamente importanti nel nostro mondo. Sempre più attività commerciali vengono svolte in digitale. Dopotutto, chi vuole avere a casa faldoni e faldoni di carta quando tutto sta in un disco da 3,5 pollici? Ma le domande che quasi nessuno si pone sono le seguenti:

  • Quanto spazio di archiviazione mi serve? Nel corso degli anni ho preso l'abitudine di acquistare sempre una o due misure in più del necessario. Semplicemente perché non voglio sostituire i dischi così spesso
  • Dove dovrebbe trovarsi fisicamente il disco? Nel PC/laptop? In un NAS? Nel cloud?
  • Quanto durerà il disco? Nel corso degli anni, ho preso l'abitudine di acquistare dischi 24/7 in generale.

Al momento consiglio un NAS come soluzione a lungo termine, che sto testando.

Non sono molto entusiasta dei cloud, anche se uso Google Drive. Mi piace quando la sovranità dei dati spetta a me. La mia configurazione consigliata, dato che i dischi IronWolf offrono funzionalità aggiuntive sul NAS Synology:

I dischi rossi IronWolf sono installati nel mio PC. Due dischi da 2 TB progettati per funzionare 24 ore su 24 e un SSD il cui contenuto è essenzialmente "tutto ciò che posso installare". L'SSD è il disco che posso semplicemente formattare in caso di attacco di un virus o simili e poi configurare di nuovo. In questo modo cerco di rendere il mio archivio il più duraturo possibile. Questo sistema funziona abbastanza bene da qualche anno a questa parte.

I dischi M.2 sono installati nel mio computer server, che a casa non fa altro che calcolare i dati e inviarli ai dispositivi su cui lavoro al di fuori della rete domestica. I dischi hanno l'aspetto di una barra di RAM e sono ancora piuttosto veloci. Ho sostituito il disco originale fornito con il NUC perché ho una distro Linux in esecuzione sul NUC e non volevo distruggere una configurazione di Windows 10 perfettamente funzionante.

Ho anche varie chiavette USB di tutti i tipi, oltre ad alcuni hard disk USB esterni. Le ricevo da produttori con dati di stampa e quindi, dopo la formattazione, entrano a far parte della mia vita quotidiana in ufficio. Personalmente, però, ho avuto buone esperienze con le chiavette HyperX. L'unica cosa importante è che il fattore di forma delle chiavette sia il più stretto possibile e che siano compatibili con l'USB 3.

Calcoliamo la quantità di spazio di archiviazione dei dati che ho a casa:

  • NAS: 8x4000 = 32.000 GB
  • PC: 2x4000+256 = 8256 GB
  • NUC: 256 + 8000 = 8256 GB
  • USB: 3 x 64 + 32 = 224 GB
  • Totale: 48 736 GB o 48,7 TB

Ammetto che il mio NAS è un po' troppo grande. Se hai critiche, suggerimenti per migliorare o idee, fammelo sapere in un commento. Perché anche se tutti i componenti del PC alla fine fanno schifo, lo spazio di archiviazione è importante per me.

Si tratta di spazio per i miei dati personali, ovvero foto delle vacanze, fatture scansionate, testi, film, musica e qualsiasi altra cosa si trovi su un disco rigido. I dati più vecchi sui miei dischi risalgono a prima dell'anno 2000 e durante questo calcolo mi sono chiesto come si sviluppano i database pubblici.

Wikipedia nel 28° secolo

Se ho già 48,7 TB, allora Wikipedia deve essere gigantesca. Perché non c'è quasi nulla che Wikipedia non conosca o di cui non abbia informazioni. Ma quanto è grande Wikipedia?

Siccome Wikipedia è in costante crescita, ho semplicemente dato un'occhiata alla pagina principale del 14 luglio. Lì Wikipedia afferma che le dieci versioni linguistiche più grandi hanno insieme oltre 17.708.000 articoli. Ma a me interessa la dimensione dei dati in gigabyte. O terabyte.

Wikipedia è così gentile da fornirci i seguenti dati:

A partire da giugno 2015, il dump di tutte le pagine con la cronologia completa delle modifiche in formato XML all'indirizzo enwiki dump progress su 20150602 è di circa 100 GB compresso con 7-Zip, e di 10 TB non compresso.

C'è poi Wikimedia Commons, il database di immagini di Wikipedia. Tutti i wiki possono accedere a questo database.

La dimensione dei file multimediali di Wikimedia Commons, che comprende le immagini, i video e altri media utilizzati in tutte le Wikipedie specifiche per ogni lingua, è stata descritta come ben superiore a 23 TB alla fine del 2014.

Non sapendo se i dati della Città dei Mille Pianeti sono compressi, prendiamo come riferimento i dati non compressi. Quindi abbiamo 33 TB di dati, non compressi, che costituiscono la conoscenza collettiva degli anglofoni.

Estrapoliamo. Poiché lo sviluppo di Wikipedia nel corso degli anni segue una formula piuttosto complessa e non abbiamo dati per il futuro, trasformiamo la curva in una linea. Per farlo, calcoliamo la crescita media di Wikipedia.

La dimensione attuale di Wikipedia in lingua inglese è di 33 terabyte, cioè 33.000.000 MB, che rappresentano 5.440.850 articoli.

34 603 008 / 5 440 850 = 6.359853331740445

La dimensione media di un articolo Wiki è di 6,36 MB. Con le immagini, le modifiche e tutto il resto.

Per trovare la linea di tendenza secondo cui Wikipedia sta crescendo, calcoliamo la crescita media in base al numero di articoli. Si tratta di 302.269.4444 articoli all'anno, che corrispondono a una crescita dei dati di 1.922.389.333 MB all'anno.

Come ultimo passo, facciamo i conti nel futuro: quanto sarà grande Wikipedia ai tempi di Valerian e Laureline? Il film è ambientato nel 28° secolo, quindi tra il 2700 e il 2800. Supponendo che l'ambientazione del film sia l'anno 2700, il calcolo è questo:

(2700 - 2002) * 302 269.444 * 6.35985331740445 = 1341827755

Il volume di dati di 1.341.827.755 MB o 1.249674479 terabyte.

Nell'anno 2799, le cose appaiono un po' diverse: 265 052 711 articoli corrispondono a 1 534 066 688 megabyte, ovvero 1463 terabyte.

Ma possiamo fare di meglio, perché gli informatici sanno che se le dimensioni dei dati superano il valore 1024, ricevono una nuova unità. 1024 megabyte sono un gigabyte. 1024 gigabyte sono un terabyte. 1024 terabyte sono un petabyte. Quindi la Wikipedia della Terra avrà una dimensione compresa tra 1.249674479 e 1.428710938 petabyte all'epoca del film.

Ma questa non è la fine della storia. Il film afferma che le conoscenze dei circa 3300 popoli che vivono su Alpha sono raccolte nel database. Supponendo che tutti abbiano iniziato a raccogliere dati nel 2002, possiamo moltiplicare questa cifra.

3300 * 1.249674479 = 4123.93568007

E

3300 * 1.428710938 = 4714.7460954

Questo significa che il database della Città dei Mille Pianeti ha una dimensione compresa tra 4,0 e 4,6 exabyte. Ovviamente non compresso. Ho anche inviato una richiesta a Pornhub per conoscere le dimensioni del loro database. Solo per interesse, in modo da poter fare un calcolo simile. La risposta di Chris Jackson, direttore delle comunicazioni di Pornhub:

Abbiamo visto la tua recente richiesta e abbiamo deciso che non è qualcosa che vorremmo perseguire in questo momento. Ti ringraziamo per aver pensato a noi!

Che peccato
.
Si tratta di matematica amatoriale. Ma sono sicuro che tu o uno dei tuoi amici potete fare di meglio. Se sei in grado di farlo e di calcolare le date dei tempi di Valeriano e Laureline in modo più preciso, con curve, anni bisestili e secondi bisestili, ti prego di inviarmi un'e-mail con i tuoi dati.

E infine questo:

E' un peccato
.
E infine questo: Secondo i nostri calcoli, Wikipedia supererà la soglia dei petabyte nel 2530, per la precisione il 5 marzo 2530 alle 02:10:55.

La tua possibilità di vincere

Pathé Films ci ha gentilmente inviato una borsa piena di gadget che vorremmo regalare a te. Ma devi rispondere a una domanda nel modo più creativo possibile:

Se tu avessi accesso alla conoscenza collettiva di 3300 pianeti, cosa cercheresti?

I premi:

  • Una borsa di stoffa
  • Una tazza che cambia colore a contatto con l'acqua
  • Un set di penna e taccuino

Scrivi nei commenti quale premio desideri e cercheremo di inviarti il premio che hai ordinato. Il concorso dura fino al 26 luglio 2017, dopodiché valuteremo i risultati. Un consiglio gratuito: le tue risposte non devono necessariamente essere correlate al concorso.

Aggiornamento 19 luglio 2017: altri premi

Pathé Films è stata così gentile da inviarci altri premi. Quindi ora abbiamo tre set completi di:

  • Una borsa di stoffa
  • Una tazza che cambia colore a contatto con l'acqua calda
  • Un set di penna e taccuino

Inoltre: chiunque esegua il calcolo wiki secondo tutte le regole dell'arte e non solo calcoli linearmente, ma con una curva e tutto il resto, riceverà un biglietto gratuito per il film.

Aggiornamento 25.07.2017: Nuovo concorso

Se vuoi assicurarti un biglietto in più, puoi partecipare al secondo concorso
.

Ti potrebbe interessare anche questo

A 33 persone piace questo articolo


User Avatar
User Avatar

Giornalista. Autore. Hacker. Sono un contastorie e mi piace scovare segreti, tabù, limiti e documentare il mondo, scrivendo nero su bianco. Non perché sappia farlo, ma perché non so fare altro.


Retroscena

Curiosità dal mondo dei prodotti, uno sguardo dietro le quinte dei produttori e ritratti di persone interessanti.

Visualizza tutti