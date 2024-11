OpenGPT-X ha presentato "Teuken-7B", un modello linguistico addestrato in 24 lingue ufficiali dell'UE. Con sette miliardi di parametri e l'accesso open source, mira a promuovere la ricerca europea sull'intelligenza artificiale e a migliorare la protezione dei dati.

Probabilmente avrai sentito parlare di ChatGPT, Gemini, Claude e altri. Questi modelli linguistici di grandi dimensioni stanno rivoluzionando il modo in cui interagiamo con i computer. La maggior parte di questi modelli linguistici AI proviene dagli Stati Uniti. Il progetto di ricerca OpenGPT-X si è posto il compito di sviluppare un'alternativa europea e, soprattutto, più rispettosa della protezione dei dati.

OpenGPT-X ha recentemente pubblicato un nuovo modello linguistico di intelligenza artificiale open source chiamato "Teuken-7B", come ha annunciato l'Istituto Fraunhofer per l'analisi intelligente e i sistemi informativi IAIS . È ora disponibile su Hugging Face per ildownload.

Formazione in 24 lingue ufficiali dell'UE

Questo modello è speciale perché è stato addestrato da zero con le 24 lingue ufficiali dell'Unione Europea. Ciò significa che "Teuken-7B" è in grado di gestire particolarmente bene le lingue europee. Per distinguerlo dai modelli sviluppati negli Stati Uniti e in Cina, è stato posto l'accento anche sulla rappresentazione di lingue non inglesi.

"Teuken-7B" ha sette miliardi di parametri. Questo numero di parametri consente al modello di comprendere e generare testi complessi. Ciò lo rende particolarmente utile per l'elaborazione di testi, la traduzione e la risposta a domande. Gli sviluppatori di OpenGPT-X hanno sottolineato che "Teuken-7B" è stato progettato appositamente per essere utilizzato in diverse aree di ricerca e applicazione dell'IA. Il modello linguistico è stato addestrato utilizzando il supercomputer "Juwels" del Centro di Ricerca di Jülich in Germania.

Una delle caratteristiche di "Teuken-7B" è la sua capacità di rispondere alle domande.

Una caratteristica di "Teuken-7B" è la sua natura open source. Ciò significa che gli sviluppatori e i ricercatori di tutto il mondo hanno libero accesso al modello e possono adattarlo e svilupparlo ulteriormente in base alle loro esigenze. OpenGPT-X spera che questo possa favorire l'innovazione nella ricerca sull'intelligenza artificiale. Il modello open-source consente inoltre di utilizzarlo e svilupparlo ulteriormente in modo etico e responsabile. Il progetto di ricerca ha già annunciato che continuerà a lavorare per migliorare e ampliare "Teuken-7B".

Chi c'è dietro OpenGPT-X?

Il progetto di ricerca e sviluppo OpenGPT-X è stato fondato all'inizio del 2022. L'obiettivo è quello di sviluppare un modello linguistico di intelligenza artificiale basato sui valori europei e sulla sua diversità linguistica. È guidato dai due istituti tedeschi Fraunhofer per l'analisi intelligente e i sistemi informativi (IAIS) e per i circuiti integrati (IIS). Sono coinvolti anche l'Università Tecnica di Dresda, il Centro di Ricerca di Jülich e aziende come Aleph Alpha e Ionos.

Mistral AI: un altro pioniere europeo nel campo dell'AI

Vale la pena notare che "Teuken-7B" non è l'unico modello linguistico di IA importante proveniente dall'Europa. L'azienda francese Mistral AI ha sviluppato diversi modelli linguistici open source. Questi includono "Mistral 7B", "Mistral 8x7B" e "Mistral 8x22B". L'azienda è stata fondata nell'aprile del 2023 dai ricercatori Arthur Mensch, Timothée Lacroix e Guillaume Lample, che in precedenza hanno lavorato presso Meta e Google DeepMind.