Come funziona, cosa sa fare e come provare Sora, l’applicazione di OpenAI per generare video a partire da un testo

Sora è l’applicazione di OpenAI in grado di generare video a partire da un testo: cosa sappiamo finora

A Burano, un cane salta da un balcone all’altro delle tipiche case colorate dell’isola nella laguna veneta. La telecamera si muove in maniera fluida, inquadrando le calli circostanti in un video di pochi secondi che all’apparenza non ha nulla di diverso dai contenuti che si vedono sui luccicanti profili dei travel vlogger online. Anche se non si vede, la differenza c’è, perché il video è stato interamente generato dall’intelligenza artificiale di Sora, la nuova applicazione di OpenAI per generare video a partire da un testo. Il modello promette di rivoluzionare la concezione di video come ChatGPT ha fatto con quella di testo e Dall-E con quella di immagine. Sui profili X di OpenAI e del fondatore Sam Altman, gli esempi delle capacità di Sora – parola che in giapponese significa «cielo» – si sprecano e mostrano video con un livello di realismo che a colpo d’occhio è indistinguibile da quello di un film.


Per chi e quando sarà disponibile

«Stiamo insegnando all’intelligenza artificiale a comprendere e simulare il mondo fisico in movimento, con l’obiettivo di addestrare modelli che aiutino le persone a risolvere problemi che richiedono interazioni nel mondo reale», si legge nella pagina di presentazione di Sora. Al momento, i video non possono essere più lunghi di un minuto, e possono essere generati a partire da un testo, da un’immagine o da una breve clip che viene estesa dall’intelligenza artificiale. Per ora, Sora è disponibile solo per alcuni sviluppatori selezionati, artisti visuali, filmmaker. «Condividiamo già ora i progressi della nostra ricerca per iniziare a lavorare e ricevere feedback da persone esterne a OpenAI e per dare al pubblico un’idea di quali capacità di intelligenza artificiale sono all’orizzonte», fa sapere l’azienda, che al momento non ha svelato una data di uscita ufficiale per il modello.


Come provare Sora

Come provare Sora di OpenAI? Attualmente è necessario rientrare nelle figure selezionate che otterranno l’accesso al nuovo modello in anteprima. Ma c’è un modo di provare Sora anche se non si è tra queste. Il fondatore Sam Altman, in queste ore sta stuzzicando la fantasia dei sui follower su X. Chiede loro di scrivere dei prompt da dare in pasto a Sora per poi pubblicare il risultato. Non è chiaro per quanto continuerà. Ma se si vuole provare Sora attualmente si può provare a rispondere al tweet di Altman sperando di essere scelti. In tal caso si otterrà un video corrispondente al comando digitato. Ce ne sono di tutti i tipi, dai golden retriever che registrano un podcast in alta quota, alla nonna toscana che filma le proprie ricette, passando per la surreale gara di ciclismo tra animali acquatici.

Come funziona e cosa sa fare Sora

«Il modello ha una profonda comprensione del linguaggio, che gli consente di interpretare accuratamente le istruzioni e generare personaggi avvincenti che esprimono emozioni realistiche. Sora – continua OpenAI – può anche creare più inquadrature all’interno di un singolo video generato che mantengano accuratamente i personaggi e lo stile visivo». La compagnia assicura che Sora è in grado non solo di comprendere quali scenari e personaggi vengono descritti in un testo, ma anche come questi interagiscono nel mondo reale. Un’altra caratteristica del modello è la sua capacità di ricordare l’aspetto dei soggetti e mantenerlo identico anche quando questi rientrano nell’inquadratura dopo esserne usciti. Nell’articolo si riportano alcuni video generati da Sora.

Rischi e controversie

L’intelligenza artificiale generativa è già protagonista già pesantemente utilizzata per creare disinformazione, pornografia non consensuale e immagini che puntano a confondere chi le vede facendo apparire come vere cose che in realtà sono false. Fino a pochi anni fa, il video poteva essere considerato testimone inconfutabile di eventi accaduti. Con Sora si apre un’era in cui questa prerogativa viene meno, e OpenAi ne è consapevole: «Nonostante ricerche e test approfonditi non è possibile prevedere tutti i modi positivi in cui le persone utilizzeranno la nostra tecnologia, né come ne abuseranno», fa sapere la compagnia. Inoltre, al momento non è chiaro su quale materiale sia stato allenato il modello e, in caso questo sia coperto da copyright, come verrà gestita l’attribuzione dei diritti.

In copertina: OPENAI / Screenshot da uno dei video di presentazione di Sora

Leggi anche: