Perché Sora di OpenAi fa così paura all’industria culturale?
Il nuovo modello di Ai che trasforma in video brevi descrizioni di testo ha messo a dura prova la pazienza dei detrattori dell’intelligenza artificiale generativa.
Il nuovo modello di Ai che trasforma in video brevi descrizioni di testo ha messo a dura prova la pazienza dei detrattori dell’intelligenza artificiale generativa.
Sora è il nuovo modello di intelligenza artificiale generata text-to-video presentata da OpenAi la settimana scorsa. Come funziona? Scrivi la trama di un video, decidi dove metti le telecamere, cosa si vede, cosa accade, in quale stile e l’Ai di Sam Altman realizza un video della durata un minuto. Il servizio non è ancora aperto al pubblico anche perché devono ancora capire come proteggerla da eventuali problemi dovuti alla produzione di video falsi, ma è già nelle mani di una selezionata schiera di registi, videomaker e addetti ai lavori che hanno incominciato a produrre sui social le loro opere.
Trovate mammut che sfilano verso la «telecamera» lasciando dietro di sé nuvole di neve polverosa; una coppia di innamorati mano nella mano che passeggia per Tokyo in una giornata di neve; visioni dall’alto come quelle realizzate da sopra i tetti bianchi e blu che ricordano le case di Santorini quando cala il sole. Alcune davvero sorprendenti, soprattutto se paragonato ai generatori di video AI ampiamente disponibili come Runway Gen-2 e Imagen di Google . Poche settimane prima OpenAI afferma però che non c’è stato video editing, cioè nessun abbellimento in post produzione.
Come puoi vedere nelle clip, però, ci sono dei problemi: i palloni da basket passano attraverso i lati dei cerchi di metallo, i cani si incrociano mentre camminano e le mani a volte non assomigliano a mani umane.
OpenAI sa di non essere ancora perfetto ma sta facendo passi da gigante. In un terreno che però è diverso da quelli percorsi finora dall’Ai Gen. E infatti Sora è ,più che ChatGpt e Dall-E, un osservato speciale.
Il video è a tutti gli effetti l’ultimo tabù. Che non è caduto – quantomeno non del tutto caduto – ma che ha messo a dura prova la pazienza dei detrattori dell’intelligenza artificiale generativa.
Concettualmente è una invasione di campo definitiva perché dopo testo e immagini anticipa ma solo di poco altri luoghi della creatività come la musica e il videogioco. Per alcuni l’Ai generativa si sarebbe dovuta fermare alla scrittura. Così non è stato. In queste settimane si alzeranno mani, qualcuno protesterà che è tutto finito, che il cinema, l’arte, la televisione verranno cannibalizzati dalle macchine. Si andranno a cercare registi delle vecchia guardia per strappargli qualche dichiarazione anti-modernista. Si celebrerà il bel mondo antico e la qualità dell’analogico. Quando la polvere si sarà posata, ci accorgeremo che nessuno vuole automatizzare il video. Ma che siamo di fronte a un nuovo strumento che non fa cose nuove ma dà forma a più idee. Forse renderà più facile la produzione di spot, sicuramente non cambierà di una virgola le leggi gravitazionali della produzione di audiovideo per l’intrattenimento. L’unica cosa che cambierà è una intenzione. La nascita di una nuova generazione di artisti digitali capaci di inventare qualcosa di nuovo.