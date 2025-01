Les actions de Nvidia et d'autres sociétés de technologie ont perdu énormément de valeur. La raison en est DeepSeek. Le modèle d'IA chinois montre à quel point la domination américaine est fragile.

La start-up chinoise DeepSeek n'a qu'un an. Mais sa nouvelle application d'intelligence artificielle s'est hissée à la première place de l'App Store d'Apple durant le week-end - et surprend par ses performances, qui semblent même dépasser les modèles établis d'OpenAI, Meta et Google.

DeepSeek remet ainsi en question la suprématie américaine en matière d'IA, quasiment sans crier gare. En conséquence, les actions des grands groupes tech sont en chute libre. L'indice Nasdaq a parfois perdu jusqu'à 5 pour cent, ce qui est extrêmement important pour une journée. Nvidia a même perdu jusqu'à 18 pour cent.

Une performance de pointe pour une fraction de l'effort

Depuis le début de l'engouement pour l'IA début 2022, les investisseurs ont injecté un total de 15 000 milliards de dollars (15 000 milliards d'euros) dans les entreprises du Nasdaq. Une grande partie de ces valorisations élevées repose sur l'espoir que les modèles d'IA deviendront des modèles commerciaux lucratifs à l'avenir. Les bénéfices réels de Google, Microsoft et autres ont certes également augmenté, mais beaucoup moins que les cours des actions. Wall Street est donc très sensible aux signes de faiblesse ou à une concurrence inattendue.

DeepSeek fait partie de cette dernière. Ce qui choque le plus les analystes dans le nouveau modèle d'IA : Le développement, la formation et l'exploitation semblent être massivement moins chers que ceux des entreprises leaders du marché comme OpenAI. Pour simplifier, il semblerait que la start-up chinoise obtienne des performances comparables avec une fraction de l'effort requis.

DeepSeek R1 devrait rivaliser avec les modèles leaders du marché dans de nombreux benchmarks.

Source : DeepSeek

Selon les propres déclarations de l'entreprise, le développement du nouveau modèle d'IA DeepSeek R1 a coûté l'équivalent de moins de six millions de dollars américains. OpenAI aurait dépensé environ 100 millions de dollars pour le développement de GPT-4o. L'entraînement de DeepSeek n'a duré que 2,78 millions d'heures de GPU. Llama 3.1, le modèle comparable de Meta, a nécessité 30,8 millions d'heures de GPU.

Ce n'est pas tout : les modèles américains nécessitent les derniers GPU de Nvidia, que le fondateur et PDG Jensen Huang se fait littéralement dorer en retour. Comme il ne peut pas les exporter en Chine, Nvidia n'y vend que des accélérateurs plus anciens. Mais grâce à des algorithmes plus efficaces, DeepSeek a manifestement réussi à entraîner et à exploiter un modèle performant, à un prix nettement plus bas. Toutefois, les serveurs fonctionnent actuellement à la limite de leurs capacités en raison d'un trafic plus important que prévu.

Des doutes sur la neutralité politique

DeepSeek R1 est open source. Le PDG d'OpenAI, Sam Altman, accuse du bout des lèvres la start-up chinoise sur X de copier ChatGPT : "Il est facile de copier quelque chose dont on sait qu'il fonctionne". Cependant, ChatGPT n'est pas un modèle open source qu'il serait facile de copier. DeepSeek semble plutôt s'être inspiré de l'architecture, avoir entraîné le modèle avec les sorties GPT et s'être basé dessus.

Comme pour d'autres modèles d'IA, la neutralité politique de DeepSeek est sujette à caution. L'IA bloque par exemple les requêtes sur la place Tian'anmen, Taïwan ou le Tibet. Le bot refuse également de donner des réponses détaillées aux questions sur le président chinois Xi Jinping - alors qu'il en est capable pour d'autres personnalités politiques.