
En coulisse
Valérian et la Cité des mille planètes : un aperçu de l'avenir du stockage de données (et un concours)
par Dominik Bärlocher
La semaine dernière, dans un article, j'ai calculé la taille de Wikipédia en l'an 2700. Dans l'article, je vous ai demandé d'améliorer le calcul si vous le pouviez. Le lecteur Lars Pautsch a proposé une estimation de la taille de Wikipédia à l'époque de Valérian.
Lars Pautsch est en fait responsable de la formation en ligne au Centre de formation dans le domaine de la santé du canton de Zurich, mais pendant son temps libre, il est fan de science-fiction et répare de vieux vélos. L'e-mail qu'il m'a envoyé commence par ces mots : "Votre article sur le film de Luc Besson (que je n'ai malheureusement pas encore vu) était si fascinant que j'ai dû le lire". Ce faisant, il est tombé sur le paragraphe de mon article dans lequel je demande aux maniaques des chiffres de mieux faire mon calcul.
Ma question : quelle sera la taille de Wikipédia en 2700?
.
Si je pose cette question, c'est parce que le film "Valérian et la Cité des mille planètes" met en scène la base de données de la station spatiale Alpha. Cette base de données rassemble les connaissances collectives de plus de 3300 planètes. J'ai donc calculé la croissance moyenne de Wikipédia, puis je l'ai calculée de manière linéaire jusqu'en 2700, avant de la multiplier par 3300. Je me suis rendu compte que le calcul était inexact avant même de le faire
.
Lars écrit : "Je pensais qu'on pouvait simplement détourner le calcul des intérêts composés et faire le calcul pour la courbe exponentielle. Je ne suis pas sûr que cela convienne vraiment, mais cela valait la peine d'essayer"
.
Le designer de 38 ans a également expliqué lui-même le calcul et l'a joint au mail dans une feuille Excel.
Il a tiré les données de base de mon article :
Son explication : "Pour que la quantité d'articles n'augmente pas de la même manière, mais que chaque année les nouveaux articles de l'année soient ajoutés et qu'il en résulte une augmentation exponentielle de la quantité d'articles, je me suis basé sur la formule des intérêts composés : Ke=Ka(1+p/100)^n"
"Ainsi, le capital final (ici, notre quantité d'articles finale recherchée ou, en fin de compte, la quantité de données finale) est multiplié par un montant selon la formule du taux d'intérêt annuel p (dans ce cas, il s'agit de la croissance des articles par laquelle la quantité totale d'articles augmente en plus chaque année) multiplié par le nombre d'années de la durée (ici, 2700-2002 = 698 ans de durée)"
.
Avant cela, il a calculé le taux d'intérêt. Voici comment procéder :
Articles par an / nombre total d'articles * 100
ou
302269.4444 / 5440850 *100 = 5.55555554739
De là, il tire le calcul suivant :
Quantité d'articles finale recherchée en 2700 = quantité totale d'articles en 2002 (ici 5440850 articles) * (1+croissance des articles comme taux d'intérêt (ici 5.55555554739)/100) élevée au nombre d'années de durée (ici 698)
ou
x = 5440850 * (1+5.55555554739/100)^698
Depuis le bateau, il est clair que ce chiffre sera très élevé. Le nombre d'articles est encore gérable, puisqu'il est de 133 497 045 298 808 000 000 selon Lars. Si votre rédacteur ne se trompe pas, cela fait environ 133 sextillions d'articles.
À partir de là, c'est plus simple. En effet, un article pèse 6,36 Mo. Lars a donc simplement multiplié les 133 sextillions par 6.36.
133497045298808000000000*6.35985333174044 = 8.49022E+23
Bon, c'est là que les choses se corsent. Le résultat est encore plus incompréhensible que les 133 sextillions. Mais Lars a fait l'effort de le décomposer.
"Si vous comptez les zéros : Selon abakus-friedrich, 1x10²³ représente 100 trilliards.
La conversion est décrite ici : Et si vous ajoutez 3 aux 18 zéros de l'exaoctet, vous arrivez à des zettaoctets avec 21 zéros et nous avons 23. D'où 849 zettaoctets... plus / moins."
Multipliez ensuite cela par 3300.
8.49022E+23 * 3300 = 2.8017726e+27
Ou, plus respectueux de l'homme
849 * 3300 = 2801700
Ce qui fait 2 801 700 zettaoctets. Et c'est là que les choses se corsent vraiment. Cela représente environ 2801,7 yottabytes. D'ailleurs, contrairement à toutes les rumeurs, cette unité ne porte pas le nom du personnage Yoda de Star Wars. Ou justement 2,8 xenottabytes.
Wikipedia a d'ailleurs un petit fait intéressant sur le yottabyte.
Tout calcul mis à part, la question se pose : Lars, pourquoi fais-tu ça ? "Je suis fan des films de Luc Besson. Je trouve qu'il fait, avec Ridley Scott, les meilleurs films qui soient. Mon film préféré de lui est le "Cinquième élément" avec Milla Jovovich", écrit-il.
Cela lui suffit pour calculer combien de yottaoctets ou de xénottaoctets aura une base de données.
Mais Lars admet que le calcul est probablement faux. "C'est juste un peu de mathématiques amusantes", dit-il. Il n'est pas tout à fait sûr que le calcul fonctionne ainsi et que le résultat soit réaliste d'une manière ou d'une autre.
Donc, vous pouvez faire mieux ? Calcule la taille de Wikipédia en 2700, avec la courbe et tout, et envoie-moi un mail. Parce que je pense qu'on va y arriver. Comme Lars a gagné le ticket de cinéma, nous aurions été à court de prix. Auraient été. Car chez Pathé Films, les distributeurs de films responsables ont fouillé dans leurs armoires et leurs tiroirs et ont trouvé une autre tasse qui change de couleur. A celui qui ose la facture, elle appartient.
Pour finir, voici ce qu'il en est : Dans la bande-annonce de "Valérian et la Cité des mille planètes", on entend d'ailleurs une reprise de la chanson "Gangsta's Paradise" de Coolio. Vous ne croyez pas?
Voici la bande-annonce:
Et voici la chanson sans les effets sonores et tout:
Journaliste. Auteur. Hackers. Je suis un conteur d'histoires à la recherche de limites, de secrets et de tabous. Je documente le monde noir sur blanc. Non pas parce que je peux, mais parce que je ne peux pas m'en empêcher.