Novità e trend

L'intelligenza artificiale trasforma il linguaggio in ritratti: i ricercatori del MIT riescono a stupire le cose

Martin Jud
7.4.2022
Traduzione: tradotto automaticamente

Nel 2019, i ricercatori del Massachusetts Institute of Technology (MIT) hanno presentato un algoritmo che oggi offre risultati sorprendenti grazie all'intelligenza artificiale (AI). L'intelligenza artificiale utilizza una registrazione vocale per creare un volto corrispondente.

I risultati non sono ancora perfetti, ma in alcuni casi già dannatamente vicini al volto originale. Un'intelligenza artificiale si allena utilizzando i video di Youtube e un algoritmo di > < href = "https://arxiv.org/abs/1905.09773"</a> - chiamato Speech2Face. L'algoritmo è stato scritto da scienziati per l'intelligenza artificiale del Computer Science and Artificial Intelligence Laboratory (CSAIL), che appartiene al MIT. Hanno creato un'intelligenza artificiale che trasforma le registrazioni vocali di tre secondi in ritratti in base ai parametri impostati e alla loro esperienza accumulata.</p>\n

Molti risultati hanno una grande somiglianza con la persona dietro la voce.</p>\n

[[immagine:61762622]]</deeplIgnore></p>\n

Come funziona Speech2Face</h2>\n

I ricercatori hanno raggiunto questo obiettivo "alimentando" la rete neurale artificiale con milioni di video di YouTube. Video di persone che parlano davanti alla telecamera. L'IA è stata incaricata di trovare caratteristiche sonore che possono essere attribuite a determinate caratteristiche facciali e altre caratteristiche. Senza un aiuto esterno, l'IA ha imparato a dedurre età, sesso, etnia e altro ancora e a generare ritratti dalle informazioni.</p>\n

I ricercatori hanno anche sviluppato un decoder facciale che ricostruisce un ritratto frontale da un'immagine fissa di YouTube. Il software lo fa indipendentemente dall'illuminazione e dalla posa della persona fotografata. Sono utilizzati per rivedere i ritratti frontali creati da Speech2Face. Risultati impressionanti si uniscono.</p>\n

All'estrema sinistra puoi vedere l'immagine fissa di Youtube. Nel mezzo, l'immagine di prova generata dall'immagine fissa di Youtube per la revisione. E a destra, l'immagine generata puramente da una breve registrazione vocale.</p>\n

[[immagine:61762623]]</deeplIgnore></p>\n

A proposito, registrazioni vocali più lunghe portano a un risultato migliore. I ricercatori lo dimostrano con i seguenti esempi, che sono stati creati da frammenti audio di tre o sei secondi.</p>\n

[[immagine:61762625]]</deeplIgnore></p>\n

Al momento, l'IA ha ancora problemi con le voci maschili alte, che sono spesso interpretate come femminili. Inoltre, gli uomini asiatici che parlano inglese americano ricevono ritratti che assomigliano a uomini bianchi. Se la stessa persona parla nella sua lingua madre, viene assegnata l'etnia corretta.</p>\n

[[immagine:61762624]]</deeplIgnore></p>\n

I ricercatori sperano in risultati ancora più precisi se forniranno più dati di formazione più rappresentativi dell'intera popolazione mondiale. Sono consapevoli che l'IA sta attualmente lottando con i pregiudizi del razzismo e stanno cercando di porre rimedio a questa situazione.</p>\n

E per quanto riguarda la protezione dei dati?</h2>\n

Anche se ci sono ragioni scientifiche dietro questo progetto, sorgono domande sull'abuso. I ricercatori ritengono che il loro sistema non sia in grado di rivelare la vera identità di una persona basata sulla voce. L'intelligenza artificiale è addestrata per acquisire caratteristiche basate sull'input vocale che molte persone hanno in comune. Ciò si traduce in volti dall'aspetto medio con caratteristiche visive tipiche.</p>\n

Resta da vedere se questo rimarrà il caso. Se vuoi ascoltare come suona la registrazione vocale originale su un'immagine generata, puoi trovare e esempi</a>.</p>\n

</p></deeplignore></p></h2></deeplignore>

A 34 persone piace questo articolo


User Avatar
User Avatar

La mia musa ispiratrice si trova ovunque. Quando non la trovo, mi lascio ispirare dai miei sogni. La vita può essere vissuta anche sognando a occhi aperti.


Informatica
Segui gli argomenti e ricevi gli aggiornamenti settimanali relativi ai tuoi interessi.

15 commenti

Avatar
later