En coulisse

Valérian et la Cité des mille planètes : un aperçu de l'avenir du stockage de données (et un concours)

Dominik Bärlocher
18/7/2017
Traduction : traduction automatique

J'ai déjà vu le film "Valerian and the City of a Thousand Planets". Outre le spectacle, je retiens surtout une chose : L'immense entrepôt de données dans la ville spatiale Alpha. J'ai donc décidé de me pencher sur le thème.

Délire.

Une question de mémoire électronique

Les données sont extrêmement importantes dans notre monde. De plus en plus de transactions se font par voie numérique. Qui a envie d'avoir des dossiers papier à la maison alors que tout cela tient sur un disque dur de 3,5 pouces ? Mais les questions que peu de gens se posent sont les suivantes:

  • De quelle capacité de stockage ai-je besoin ? Au fil des années, j'ai pris l'habitude d'acheter une ou deux tailles de plus que nécessaire. Simplement parce que je ne veux pas remplacer les disques aussi souvent
  • Où le disque doit-il être physiquement ? Dans un PC/ordinateur portable ? Un NAS ? Dans le cloud?
  • Quelle est la durée de vie du disque ? Au fil des années, j'ai pris l'habitude d'acheter des disques durs 24h/24 et 7j/7

Actuellement, je recommande comme solution à long terme un NAS, que j'ai actuellement en test.

Je ne suis pas très enthousiaste à l'égard du cloud, même si j'utilise Google Drive. En effet, j'aime que la souveraineté des données me revienne. Ma configuration recommandée, car les disques IronWolf offrent des fonctionnalités supplémentaires sur le NAS Synology :

Mon PC est équipé de WD Reds. Deux disques de 2 TB conçus pour fonctionner 24 heures sur 24, auxquels s'ajoute un SSD dont le contenu est essentiellement "tout ce que je peux installer". Le SSD est le disque que je peux facilement formater en cas d'attaque de virus ou autre, puis réinitialiser. J'essaie ainsi de faire en sorte que mon stockage dure le plus longtemps possible. Cela fonctionne plutôt bien depuis quelques années.

Pour cela, j'ai diverses clés USB de toutes sortes, ainsi que quelques disques durs externes USB. Les fabricants me les fournissent avec des données de presse et, après un formatage, ils trouvent également leur place dans mon quotidien au bureau. Personnellement, j'ai eu de bonnes expériences avec les clés HyperX. Ce qui compte, c'est que le format des clés soit le plus fin possible et qu'elles soient compatibles USB 3.

Alors, faisons le compte de ce que j'accumule chez moi en matière de stockage de données :

  • NAS : 8x4000 = 32 000 GB
  • PC : 2x4000+256 = 8256 GB
  • NUC : 256 + 8000 = 8256 GB
  • USB : 3 x 64 + 32 = 224GB
  • Total : 48 736 Go ou 48,7 TB

Je reconnais que mon NAS est un peu excessivement grand. Si vous avez des critiques, des suggestions d'amélioration ou des idées, n'hésitez pas à me le faire savoir dans un commentaire. Car même si toutes les pièces de l'ordinateur finissent par être de la camelote, la mémoire est importante pour moi.

C'est juste de la place pour mes données personnelles, c'est-à-dire mes photos de vacances, mes factures scannées, mes textes, mes films, ma musique et tout ce qui traîne sur un disque dur. Les données les plus anciennes sur mes disques datent d'avant l'an 2000. Pendant ce calcul, je me suis demandé comment les bases de données publiques allaient évoluer.

Wikipedia au 28e siècle

Si j'ai déjà 48,7 TB, Wikipédia doit être gigantesque. Car il n'y a pratiquement rien que Wikipédia ne sache pas ou n'ait pas d'informations à ce sujet. En fait, quelle est la taille de Wikipédia ?

Comme Wikipédia ne cesse de grandir, j'ai simplement consulté le 14 juillet la page principale. Wikipedia y indique que les dix plus grandes versions linguistiques totalisent plus de 17 708 000 articles. Ce qui m'intéresse, c'est la taille des données en gigaoctets. Ou des téraoctets.

Au mois de juin 2015, le dump de toutes les pages avec l'historique complet des modifications au format XML sur enwiki dump progress sur 20150602 est d'environ 100 GB compressés en utilisant 7-Zip, et 10 TB non compressés.

À cela s'ajoute Wikimedia Commons, la base de données d'images de Wikipédia. Tous les wikis peuvent accéder à cette base de données.

La taille des fichiers médias dans Wikimedia Commons, qui comprend les images, vidéos et autres médias utilisés à travers tous les Wikipédias spécifiques à une langue, a été décrite comme dépassant 23 TB à la fin de l'année 2014.

Comme nous ne savons pas si les données de la Cité des mille planètes sont compressées, nous prenons les données non compressées comme référence. Nous avons donc 33 TB de données, non compressées, qui constituent la connaissance collective des anglophones.

Alors, extrapolons. Comme l'évolution de Wikipédia au fil des ans suit une formule assez complexe et que nous n'avons pas de données pour l'avenir, nous transformons la courbe en ligne. Pour cela, nous calculons la croissance moyenne de Wikipédia.

La taille actuelle de Wikipédia en anglais est de 33 téraoctets, soit 33 000 000 de Mo, ce qui représente 5 440 850 articles.

34 603 008 / 5 440 850 = 6.359853331740445

Un article wiki pèse donc en moyenne 6,36 Mo. Avec des images, toutes les éditions et tout le reste.

Pour trouver la ligne de tendance selon laquelle Wikipédia croît, nous calculons la croissance moyenne en fonction des articles. Cela représente 302 269 4444 articles par an, soit une croissance des données de 1 922 389 333 Mo par an.

La dernière étape consiste à faire le calcul dans le futur : quelle sera la taille de Wikipédia à l'époque de Valérian et de Laureline ? Le film se déroule au 28ème siècle, donc quelque part entre 2700 et 2800. En supposant que le cadre du film est l'année 2700, le calcul est le suivant :

(2700 - 2002) * 302 269.444 * 6.35985331740445 = 1341827755

Le volume de données de 1 341 827 755 Mo ou 1.249674479 téraoctets.

En 2799, la situation est un peu différente : 265 052 711 articles correspondent à 1 534 066 688 mégaoctets, ou 1463 téraoctets.

Mais nous pouvons faire mieux, car les informaticiens savent que si la taille des données dépasse la valeur 1024, elle reçoit une nouvelle unité. 1024 mégaoctets sont un gigaoctet. 1024 gigaoctets sont un téraoctet. 1024 téraoctets sont un pétaoctet. Donc, au moment du film, le Wikipédia de la Terre aura une taille comprise entre 1.249674479 et 1.428710938 pétaoctets.

Mais nous ne sommes pas au bout de nos peines. Dans le film, on découvre que les connaissances des quelque 3300 peuples qui vivent sur Alpha sont rassemblées dans la base de données. En supposant qu'ils ont tous commencé à collecter des données en 2002, nous pouvons multiplier ce chiffre
.

3300 * 1.249674479 = 4123.93568007

Et

3300 * 1.428710938 = 4714.7460954

Cela signifie que la base de données de la Cité des mille planètes a une taille comprise entre 4,0 et 4,6 exaoctets. Non compressée, bien sûr. J'ai également envoyé une demande à Pornhub concernant la taille de leur base de données. Simplement par intérêt, pour ensuite faire un calcul similaire. La réponse de Chris Jackson, directeur de la communication de Pornhub :

Nous avons vu votre récente demande et avons décidé que ce n'était pas quelque chose que nous voulions poursuivre à ce moment. Merci d'avoir pensé à nous!

C'est dommage.

Ce sont des mathématiques d'amateur. Mais je suis sûr que toi ou l'une de tes connaissances pouvez faire mieux. Si tu peux le faire et calculer plus précisément les dates à l'époque de Valérien et de Laureline, avec la courbe et les années bissextiles et les secondes intercalaires, envoie-moi un mail avec tes chiffres.

Pour finir, voici ce qu'il en est : Selon nos calculs, Wikipédia dépassera la limite du pétaoctet en 2530. Le 5 mars 2530 à 02:10:55 pour être précis.

Votre chance de gagner

Pathé Films a eu la gentillesse de nous faire parvenir un sac de goodies que nous aimerions vous faire gagner. Pour cela, vous devez répondre à une question de la manière la plus créative possible :

Si vous aviez accès aux connaissances accumulées de 3300 planètes, que rechercheriez-vous ?

Les prix :

  • Un sac en tissu
  • Une tasse qui change de couleur au contact de l'eau
  • Un ensemble stylo et carnet

N'hésitez pas à indiquer en commentaire le prix que vous souhaitez recevoir et nous essaierons de vous envoyer, dans la mesure du possible, le prix que vous avez commandé. Le concours est ouvert jusqu'au 26 juillet 2017, après quoi nous ferons le dépouillement. Et conseil gratuit : vos réponses ne doivent pas nécessairement avoir un rapport avec le concours.

Mise à jour du 19 juillet 2017 : plus de prix

Pathé Films a eu la gentillesse de nous envoyer plus de prix. Nous avons donc désormais trois sets complets de :

  • Un sac en tissu
  • Une tasse qui change de couleur au contact de l'eau chaude
  • Un set composé d'un stylo et d'un carnet

En plus, si vous faites le calcul Wiki dans les règles de l'art et que vous ne vous contentez pas de faire un calcul linéaire mais que vous faites une courbe et tout, vous recevrez un ticket gratuit pour le film.

Mise à jour du 25 juillet 2017 : nouveau concours

Si vous voulez vous assurer une place supplémentaire, vous pouvez participer au deuxième concours.

Cela pourrait aussi vous intéresser

Cet article plaît à 33 personne(s)


User Avatar
User Avatar

Journaliste. Auteur. Hackers. Je suis un conteur d'histoires à la recherche de limites, de secrets et de tabous. Je documente le monde noir sur blanc. Non pas parce que je peux, mais parce que je ne peux pas m'en empêcher.


En coulisse

Des informations intéressantes sur le monde des produits, un aperçu des coulisses des fabricants et des portraits de personnalités intéressantes.

Tout afficher