
OpenAI Sora: il nuovo modello di intelligenza artificiale text-to-video offre risultati incredibili

Non molto tempo fa, i video di intelligenza artificiale ricordavano i brutti viaggi in droga. Oggi le cose stanno cambiando: OpenAI ha presentato il suo modello di AI text-to-video Sora. I video creati con questo modello, che possono durare fino a 60 secondi, sono davvero notevoli.
La società di software statunitense OpenAI ha presentato un nuovo modello di AI. Sora converte i messaggi di testo in complesse scene video della durata massima di un minuto. Questi possono contenere diversi personaggi e fornire risultati realistici e fantasiosi che sono quasi impossibili da esprimere a parole. E questo nonostante i video stessi siano basati sulle parole. La seconda scena del seguente video si basa sul seguente testo: "Una cucciolata di cuccioli di Golden Retriever sta giocando nella neve. Le loro teste spuntano dalla neve e ne sono ricoperte."
Se vuoi sapere quale input di testo ha portato al rispettivo risultato, puoi trovare i singoli video e le richieste sul sito web di OpenAI.
Sora non solo ha una profonda comprensione del linguaggio per interpretare gli input, ma anche una conoscenza del comportamento delle cose nel mondo fisico. Tuttavia, i video sono ancora lontani dall'essere perfetti. Se li guardi da vicino, scoprirai qualche strano errore.
OpenAI sa anche questo. L'azienda sottolinea che la fisica presenta dei punti deboli nelle scene complesse. I dettagli spaziali possono generare confusione, così come le sequenze temporali, come ad esempio le riprese di inseguimento. OpenAI sottolinea anche che è possibile che Sora non capisca alcuni casi di causa ed effetto: "Ad esempio, una persona potrebbe mordere un biscotto, ma in seguito il biscotto potrebbe non mostrare il segno del morso."
Tecnicamente parlando, Sora è un modello di diffusione in grado di creare interi video in una sola volta o di estenderne uno esistente. È anche possibile utilizzare un'immagine fissa come modello invece di inserire del testo. Per ora, Sora è disponibile solo per un gruppo selezionato di tester. Non è ancora chiaro quando il modello di intelligenza artificiale verrà rilasciato al pubblico e a che prezzo.


La mia musa ispiratrice si trova ovunque. Quando non la trovo, mi lascio ispirare dai miei sogni. La vita può essere vissuta anche sognando a occhi aperti.