
Test de produit
NAS: la sauvegarde de données dans les foyers modernes
par Dominik Bärlocher
J'ai déjà vu le film "Valerian and the City of a Thousand Planets". Outre le spectacle, je retiens surtout une chose : L'immense entrepôt de données dans la ville spatiale Alpha. J'ai donc décidé de me pencher sur le thème.
Luc Besson, avec son nouveau long métrage "Valérian et la Cité des mille planètes", crée un monde qui n'existe que dans le classique de la bande dessinée. Des vaisseaux spatiaux traversant l'espace du 28ème siècle à une vitesse supérieure à celle de la lumière et quelque part là-bas : La station spatiale Alpha. Alpha était autrefois quelque chose comme la Station spatiale internationale (ISS), qui tourne autour de la Terre depuis maintenant 18 ans. (Petit détail en passant : le nom d'appel de l'ISS est également "Alpha"). Dans le film, Alpha se développe de plus en plus, des contacts diplomatiques sont établis entre les peuples de la Terre et de l'espace, et à un moment donné, Alpha devient trop grande. Comme la station spatiale a atteint la taille d'une lune et que sa gravité affecte la Terre, des moteurs massifs sont installés et Alpha entame un long voyage à travers l'espace.
Aujourd'hui, partout où Alpha va, et quels que soient les peuples qui s'installent sur la station qui ne cesse de grandir : Le gouvernement de la station accumule les connaissances. Au 28ème siècle, lorsque l'intrigue des agents Valérian et Laureline commence, un quartier entier - Alpha est systématiquement considérée comme une ville - est uniquement occupé à stocker ce savoir. Deux courtes scènes montrent ce quartier : Les murs sont remplis de disques d'or, entretenus par la race extraterrestre des Omelites, qui échangent probablement les disques durs défaillants et gèrent les connaissances accumulées sur plus de 3300 planètes. D'après le film, ce quartier ne contient même pas les données personnelles des 30 millions d'habitants d'Alpha, mais seulement les connaissances accumulées.
Délire.
Clairement, le film offre bien plus qu'une quantité folle de données. Il y a aussi l'intrigue au rythme effréné, les effets spéciaux convaincants de bout en bout, mon personnage secondaire préféré sous la forme de la styliste des Boulan-Bathor - soyons honnêtes, personne ne se réjouit aussi sincèrement de son travail qu'elle - et le héros en titre, Valérian, avec sa compagne Laureline, dont le nom aurait pu figurer sans gêne dans le titre du film. Car en tant que fan de BD, je sais que Laureline est plus qu'un appendice de Valérian.
Mais au final, le passionné de technologie que je suis s'est arrêté sur une idée : Le stockage des données. Car les disques durs sont une chose à laquelle nous pensons rarement. La plupart des ordinateurs sont livrés avec un disque dur préinstallé, s'il est cassé, on le remplace par n'importe quelle pièce, et le stockage externe nous est souvent aussi cher qu'Heiri. L'essentiel est que cela fonctionne. Je profite donc de l'occasion et d'une recommandation de film pour parler rapidement des supports de stockage. Bonne transition, hein ?
Les données sont extrêmement importantes dans notre monde. De plus en plus de transactions se font par voie numérique. Qui a envie d'avoir des dossiers papier à la maison alors que tout cela tient sur un disque dur de 3,5 pouces ? Mais les questions que peu de gens se posent sont les suivantes:
Actuellement, je recommande comme solution à long terme un NAS, que j'ai actuellement en test.
Je ne suis pas très enthousiaste à l'égard du cloud, même si j'utilise Google Drive. En effet, j'aime que la souveraineté des données me revienne. Ma configuration recommandée, car les disques IronWolf offrent des fonctionnalités supplémentaires sur le NAS Synology :
Mon PC est équipé de WD Reds. Deux disques de 2 TB conçus pour fonctionner 24 heures sur 24, auxquels s'ajoute un SSD dont le contenu est essentiellement "tout ce que je peux installer". Le SSD est le disque que je peux facilement formater en cas d'attaque de virus ou autre, puis réinitialiser. J'essaie ainsi de faire en sorte que mon stockage dure le plus longtemps possible. Cela fonctionne plutôt bien depuis quelques années.
Mon ordinateur serveur, qui ne fait rien d'autre à la maison que de calculer des données et de les envoyer sur les appareils sur lesquels je travaille en dehors de mon réseau domestique, est équipé d'un disque M.2. Les disques ressemblent visuellement à une barre de RAM et sont pourtant assez rapides. J'ai remplacé le disque d'origine fourni avec le NUC parce que j'ai une distro Linux en cours d'exécution sur le NUC et je ne voulais pas détruire une configuration Windows 10 tout à fait correcte.
Pour cela, j'ai diverses clés USB de toutes sortes, ainsi que quelques disques durs externes USB. Les fabricants me les fournissent avec des données de presse et, après un formatage, ils trouvent également leur place dans mon quotidien au bureau. Personnellement, j'ai eu de bonnes expériences avec les clés HyperX. Ce qui compte, c'est que le format des clés soit le plus fin possible et qu'elles soient compatibles USB 3.
Alors, faisons le compte de ce que j'accumule chez moi en matière de stockage de données :
Je reconnais que mon NAS est un peu excessivement grand. Si vous avez des critiques, des suggestions d'amélioration ou des idées, n'hésitez pas à me le faire savoir dans un commentaire. Car même si toutes les pièces de l'ordinateur finissent par être de la camelote, la mémoire est importante pour moi.
C'est juste de la place pour mes données personnelles, c'est-à-dire mes photos de vacances, mes factures scannées, mes textes, mes films, ma musique et tout ce qui traîne sur un disque dur. Les données les plus anciennes sur mes disques datent d'avant l'an 2000. Pendant ce calcul, je me suis demandé comment les bases de données publiques allaient évoluer.
Si j'ai déjà 48,7 TB, Wikipédia doit être gigantesque. Car il n'y a pratiquement rien que Wikipédia ne sache pas ou n'ait pas d'informations à ce sujet. En fait, quelle est la taille de Wikipédia ?
Comme Wikipédia ne cesse de grandir, j'ai simplement consulté le 14 juillet la page principale. Wikipedia y indique que les dix plus grandes versions linguistiques totalisent plus de 17 708 000 articles. Ce qui m'intéresse, c'est la taille des données en gigaoctets. Ou des téraoctets.
.
Pour simplifier, supposons que dans Valérian et la Cité des mille planètes, la Terre stocke ses connaissances dans une langue. À l'heure actuelle, ce serait l'anglais. C'est logique, car dans Valérian, chaque être est équipé d'un implant de traduction qui permet la communication entre les espèces. Il n'y a donc pas besoin de différentes langues. Seul le format de fichier des connaissances stockées doit correspondre. Nous allons donc utiliser la version anglaise de Wikipédia, car c'est la plus grande édition à ce jour, avec ses 5 430 000 articles
.
Wikipedia a la gentillesse de nous fournir les données suivantes :
Au mois de juin 2015, le dump de toutes les pages avec l'historique complet des modifications au format XML sur enwiki dump progress sur 20150602 est d'environ 100 GB compressés en utilisant 7-Zip, et 10 TB non compressés.
À cela s'ajoute Wikimedia Commons, la base de données d'images de Wikipédia. Tous les wikis peuvent accéder à cette base de données.
La taille des fichiers médias dans Wikimedia Commons, qui comprend les images, vidéos et autres médias utilisés à travers tous les Wikipédias spécifiques à une langue, a été décrite comme dépassant 23 TB à la fin de l'année 2014.
Comme nous ne savons pas si les données de la Cité des mille planètes sont compressées, nous prenons les données non compressées comme référence. Nous avons donc 33 TB de données, non compressées, qui constituent la connaissance collective des anglophones.
Alors, extrapolons. Comme l'évolution de Wikipédia au fil des ans suit une formule assez complexe et que nous n'avons pas de données pour l'avenir, nous transformons la courbe en ligne. Pour cela, nous calculons la croissance moyenne de Wikipédia.
La taille actuelle de Wikipédia en anglais est de 33 téraoctets, soit 33 000 000 de Mo, ce qui représente 5 440 850 articles.
34 603 008 / 5 440 850 = 6.359853331740445
Un article wiki pèse donc en moyenne 6,36 Mo. Avec des images, toutes les éditions et tout le reste.
Pour trouver la ligne de tendance selon laquelle Wikipédia croît, nous calculons la croissance moyenne en fonction des articles. Cela représente 302 269 4444 articles par an, soit une croissance des données de 1 922 389 333 Mo par an.
La dernière étape consiste à faire le calcul dans le futur : quelle sera la taille de Wikipédia à l'époque de Valérian et de Laureline ? Le film se déroule au 28ème siècle, donc quelque part entre 2700 et 2800. En supposant que le cadre du film est l'année 2700, le calcul est le suivant :
(2700 - 2002) * 302 269.444 * 6.35985331740445 = 1341827755
Le volume de données de 1 341 827 755 Mo ou 1.249674479 téraoctets.
En 2799, la situation est un peu différente : 265 052 711 articles correspondent à 1 534 066 688 mégaoctets, ou 1463 téraoctets.
Mais nous pouvons faire mieux, car les informaticiens savent que si la taille des données dépasse la valeur 1024, elle reçoit une nouvelle unité. 1024 mégaoctets sont un gigaoctet. 1024 gigaoctets sont un téraoctet. 1024 téraoctets sont un pétaoctet. Donc, au moment du film, le Wikipédia de la Terre aura une taille comprise entre 1.249674479 et 1.428710938 pétaoctets.
Mais nous ne sommes pas au bout de nos peines. Dans le film, on découvre que les connaissances des quelque 3300 peuples qui vivent sur Alpha sont rassemblées dans la base de données. En supposant qu'ils ont tous commencé à collecter des données en 2002, nous pouvons multiplier ce chiffre
.
3300 * 1.249674479 = 4123.93568007
Et
3300 * 1.428710938 = 4714.7460954
Cela signifie que la base de données de la Cité des mille planètes a une taille comprise entre 4,0 et 4,6 exaoctets. Non compressée, bien sûr. J'ai également envoyé une demande à Pornhub concernant la taille de leur base de données. Simplement par intérêt, pour ensuite faire un calcul similaire. La réponse de Chris Jackson, directeur de la communication de Pornhub :
Nous avons vu votre récente demande et avons décidé que ce n'était pas quelque chose que nous voulions poursuivre à ce moment. Merci d'avoir pensé à nous!
C'est dommage.
Ce sont des mathématiques d'amateur. Mais je suis sûr que toi ou l'une de tes connaissances pouvez faire mieux. Si tu peux le faire et calculer plus précisément les dates à l'époque de Valérien et de Laureline, avec la courbe et les années bissextiles et les secondes intercalaires, envoie-moi un mail avec tes chiffres.
Pour finir, voici ce qu'il en est : Selon nos calculs, Wikipédia dépassera la limite du pétaoctet en 2530. Le 5 mars 2530 à 02:10:55 pour être précis.
Pathé Films a eu la gentillesse de nous faire parvenir un sac de goodies que nous aimerions vous faire gagner. Pour cela, vous devez répondre à une question de la manière la plus créative possible :
Si vous aviez accès aux connaissances accumulées de 3300 planètes, que rechercheriez-vous ?
Les prix :
N'hésitez pas à indiquer en commentaire le prix que vous souhaitez recevoir et nous essaierons de vous envoyer, dans la mesure du possible, le prix que vous avez commandé. Le concours est ouvert jusqu'au 26 juillet 2017, après quoi nous ferons le dépouillement. Et conseil gratuit : vos réponses ne doivent pas nécessairement avoir un rapport avec le concours.
Pathé Films a eu la gentillesse de nous envoyer plus de prix. Nous avons donc désormais trois sets complets de :
En plus, si vous faites le calcul Wiki dans les règles de l'art et que vous ne vous contentez pas de faire un calcul linéaire mais que vous faites une courbe et tout, vous recevrez un ticket gratuit pour le film.
Si vous voulez vous assurer une place supplémentaire, vous pouvez participer au deuxième concours.
Journaliste. Auteur. Hackers. Je suis un conteur d'histoires à la recherche de limites, de secrets et de tabous. Je documente le monde noir sur blanc. Non pas parce que je peux, mais parce que je ne peux pas m'en empêcher.