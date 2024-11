OpenGPT-X hat «Teuken-7B» vorgestellt, ein Sprachmodell, das in 24 EU-Amtssprachen trainiert wurde. Mit sieben Milliarden Parametern und Open-Source-Zugang zielt es auf die Förderung europäischer KI-Forschung und besseren Datenschutz ab.

Du hast sicher schon von ChatGPT, Gemini, Claude und Co. gehört. Diese großen Sprachmodelle revolutionieren derzeit die Art und Weise, wie wir mit Computern interagieren. Der Großteil dieser KI-Sprachmodelle stammt aus den USA. Das Forschungsprojekt OpenGPT-X hat sich zur Aufgabe gesetzt, eine europäische und vor allem datenschutzfreundlichere Alternative aufzubauen.

OpenGPT-X hat kürzlich ein neues Open-Source-KI-Sprachmodell namens «Teuken-7B» veröffentlicht, wie das Fraunhofer Institut Intelligente Analyse- und Informationssysteme IAIS mitteilte. Es steht ab sofort auf Hugging Face zum Download bereit.

Training in 24 EU-Amtssprachen

Dieses Modell ist besonders, weil es von Grund auf mit den 24 Amtssprachen der Europäischen Union trainiert wurde. Das bedeutet, dass «Teuken-7B» besonders gut mit europäischen Sprachen umgehen kann. Der Fokus wurde dabei sogar auf die Darstellung nicht-englischer Sprachen gelegt, um sich von den in den USA und China entwickelten Modellen abzuheben.

«Teuken-7B» verfügt über sieben Milliarden Parameter. Diese Anzahl an Parametern ermöglicht es dem Modell, komplexe Texte zu verstehen und zu generieren. Dies macht es besonders nützlich für Textverarbeitung, Übersetzung und Beantwortung von Fragen. Die Entwickler von OpenGPT-X haben betont, dass «Teuken-7B» speziell darauf ausgelegt ist, in verschiedenen Bereichen der KI-Forschung und -Anwendung einsetzbar zu sein. Trainiert wurde das Sprachmodell mithilfe des Supercomputers «Juwels» am Forschungszentrum Jülich in Deutschland.

Ein Merkmal von «Teuken-7B» ist seine Open-Source-Natur. Dies bedeutet, dass Entwickler und Forscher weltweit freien Zugang zu dem Modell haben und es nach ihren Bedürfnissen anpassen und weiterentwickeln können. OpenGPT-X hofft, dass dies die Innovation in der KI-Forschung weiter vorantreiben wird. Das Open-Source-Modell ermöglicht es auch, dass das Modell auf ethische und verantwortungsvolle Weise genutzt und weiterentwickelt werden kann. Das Forschungsprojekt hat bereits angekündigt, dass sie weiterhin an der Verbesserung und Erweiterung von «Teuken-7B» arbeiten werden.

Wer steckt hinter OpenGPT-X?

Das Forschungs- und Entwicklungsprojekt OpenGPT-X wurde Anfang 2022 gegründet. Das Ziel ist ein KI-Sprachmodell nach europäischen Werten und dessen Sprachenvielfalt. Es wird von den beiden deutschen Fraunhofer-Instituten für Intelligente Analyse- und Informationssysteme (IAIS) und für Integrierte Schaltungen (IIS) geleitet. Außerdem sind die Technische Universtität Dresden, das Forschungszentrum Jülich und Unternehmen wie Aleph Alpha und Ionos beteiligt.

Mistral AI: Ein weiterer europäischer Vorreiter im KI-Bereich

Es ist erwähnenswert, dass «Teuken-7B» nicht das einzige große KI-Sprachmodell aus Europa ist. Das französische Softwareunternehmen Mistral AI hat mehrere eigene Open-Source-Sprachmodelle entwickelt. Dazu gehören unter anderem «Mistral 7B», «Mistral 8x7B» und «Mistral 8x22B». Gegründet wurde das Unternehmen im April 2023 von den Forschern Arthur Mensch, Timothée Lacroix und Guillaume Lample, die zuvor bei Meta und Google DeepMind beschäftigt waren.