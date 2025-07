Nouveautés + tendances 156 22

L'ETH et l'EPFL présentent leur propre modèle d'IA

Samuel Buchmann Traduction: traduction automatique 11/7/2025

Un nouveau modèle de langage open source développé en Suisse prend en charge plus de 1000 langues et offre 70 milliards de paramètres. Il est donc de taille similaire à Llama 3 de Meta et devrait offrir une alternative aux LLM propriétaires.

L'ETH Zurich et l'EPFL ont développé un Large Language Model (LLM) entièrement ouvert. Il devrait être disponible à la fin de l'été 2025. Selon le communiqué de presse, le modèle prend en charge plus de 1000 langues. Il a été entraîné sur le supercalculateur «Alps» du centre suisse de supercalcul CSCS.

Contrairement aux LLM propriétaires, comme ceux d'OpenAI ou d'Anthropic, le modèle suisse mise sur la transparence. Tant le code source que les poids du modèle et les données d'entraînement sont mis à disposition. C'est jusqu'à présent rare dans le secteur. Les LLM de Meta et DeepSeek sont certes «Open Weight», mais pas entièrement «Open Source». Cela signifie que les algorithmes et les données d'entraînement restent sous clé.

En coulisse 7 questions et réponses sur DeepSeek par Samuel Buchmann

Le modèle de l'ETH sera disponible en deux versions - avec huit et 70 milliards de paramètres. Cette dernière est comparable au Llama 3 de Meta. Le GPT-4 d'OpenAI est estimé à environ 1800 milliards de paramètres et l'Anthropics Claude 4 Opus à environ 300 milliards. Le nombre de paramètres n'est pas la seule métrique de la performance d'un LLM, mais c'est une indication. Les modèles propriétaires obtiennent actuellement les meilleurs scores dans les benchmarks. Mais les modèles open source offrent des avantages en termes de traçabilité, d'adaptabilité et de contrôle des données.

La protection de la vie privée prise en compte dans la formation

La législation suisse sur la protection des données, le droit d'auteur suisse et les obligations de transparence dans le cadre du règlement de l'UE sur l'IA (UE AI Act) sont pris en compte dans le développement du LLM. Selon une dernière étude des responsables du projet, le respect des opt-outs pour l'exploration du Web lors de la collecte des données - et donc l'ignorance de certains contenus Web par la formation - n'entraîne pratiquement aucune perte de performance pour les tâches quotidiennes.

La Swiss AI Initiative a accès au supercalculateur «Alps» au CSCS.

Source : Swiss National Supercomputing Centre

Le modèle est publié sous la licence Apache 2.0. Il devrait ainsi être accessible à la fois pour des applications scientifiques et industrielles. Il est le résultat de la Swiss AI Initiative, lancée en décembre 2023 par l'EPFL et l'ETH Zurich. Avec plus de 800 chercheurs impliqués et l'accès à plus de 20 millions d'heures de GPU par an sur le supercalculateur du CSCS, il s'agit du plus grand projet de science ouverte et de source ouverte au monde sur les modèles de base de l'IA.

Photo d’en-tête : EPF Zurich

Cet article me plaît ! Cet article plaît à 156 personne(s)