
OpenAI Sora: Neues Text-to-Video KI-Modell sorgt für unglaubliche Ergebnisse

Noch vor Kurzem haben KI-Videos an schlechte Drogentrips erinnert. Spätestens heute ändert sich das, denn OpenAI hat sein Text-to-Video KI-Modell Sora vorgestellt. Die damit erstellten, bis zu 60 Sekunden langen Videos, haben es in sich.
Das US-amerikanische Software-Unternehmen OpenAI hat ein neues KI-Modell vorgestellt. Sora wandelt Text-Prompts in komplexe Videoszenen, die bis zu einer Minute lang sind. Diese können unterschiedliche Charaktere enthalten und realistische wie auch fantasievolle Ergebnisse liefern, die sich kaum in Worte fassen. Und das, obschon die Videos an sich auf Worten basieren. Die zweite, im folgenden Video zu sehende Szene, basiert auf folgendem Text-Prompt: «Ein Wurf Golden Retriever Welpen spielt im Schnee. Ihre Köpfe ragen aus dem Schnee heraus, sind damit bedeckt.»
Falls du wissen willst, welche Texteingabe zum jeweiligen Resultat geführt hat, findest du die einzelnen Videos und Prompts auf der OpenAI-Website.
Sora verfügt nicht nur über ein tiefes Sprachverständnis zum Interpretieren des Inputs, sondern auch über das Wissen, wie sich Dinge in der physischen Welt verhalten. Trotzdem sind die Videos noch alles andere als perfekt. Wenn du genau hinschaust, entdeckst du den einen oder anderen Fehler.
Das weiss auch OpenAI. Das Unternehmen weist darauf hin, dass die Physik bei komplexen Szenen Schwächen aufweist. Es könne bei räumlichen Details zu Verwechslungen kommen – ebenso bei zeitlichen Abfolgen wie einer Kamerafahrt. Dazu weist OpenAI darauf hin, dass es möglich ist, dass Sora bestimmte Fälle von Ursache und Wirkung nicht versteht: «Beispielsweise könnte eine Person in einen Keks beissen, der Keks hinterher aber möglicherweise keine Bissspur aufweisen.»
Technisch gesehen handelt es sich bei Sora um ein Diffusionsmodell, das in der Lage ist, ganze Videos auf einmal zu erstellen oder ein vorhandenes zu verlängern. Ebenso ist es möglich, anstelle des Textinputs ein Standbild als Vorlage zu nutzen. Bisher steht Sora nur einem ausgewählten Kreis von Testern zur Verfügung. Wann das KI-Modell auf die Öffentlichkeit losgelassen wird und zu welchem Preis, ist noch nicht klar.


Der tägliche Kuss der Muse lässt meine Kreativität spriessen. Werde ich mal nicht geküsst, so versuche ich mich mittels Träumen neu zu inspirieren. Denn wer träumt, verschläft nie sein Leben.