Il nuovo Make-a-Video di Meta segnala la prossima evoluzione dell’IA generativa

70

Non sei riuscito a partecipare a Transform 2022? Dai un’occhiata a tutte le sessioni del vertice nella nostra libreria on-demand ora! Guarda qui.

Questa mattina, Mark Zuckerberg, CEO di Meta, ha pubblicato sulla sua pagina Facebook l’annuncio di Make-A-Video, un nuovo sistema di intelligenza artificiale che consente agli utenti di trasformare i messaggi di testo, come “un orsacchiotto che dipinge un autoritratto”, in brevi, di alta qualità, videoclip unici.

Suona come DALL-E? Questa è l’idea: secondo un comunicato stampa, Make-A-Video si basa sulla tecnologia di generazione di immagini AI (incluso il lavoro Make-A-Scene di Meta dell’inizio di quest’anno) “aggiungendo uno strato di apprendimento non supervisionato che consente al sistema di comprendere il movimento nel mondo fisico e applicarlo alla tradizionale generazione da testo a immagine”.

“Questo è un progresso davvero sorprendente”, ha scritto Zuckerberg nel suo post. “È molto più difficile generare video che foto perché oltre a generare correttamente ogni pixel, il sistema deve anche prevedere come cambieranno nel tempo”.

Un anno dopo DALL-E

È difficile credere che sia passato solo un anno da quando il DALL-E originale è stato presentato nel gennaio 2021, mentre il 2022 sembrava essere l’anno della rivoluzione del text-to-image grazie a DALL-E 2, Midjourney, Stable Diffusion e altri modelli generativi di grandi dimensioni che consentono agli utenti di creare immagini e opere d’arte realistiche da prompt di testo naturali.

Evento

MetaBeat 2022

MetaBeat riunirà leader di pensiero per fornire indicazioni su come la tecnologia metaverse trasformerà il modo in cui tutti i settori comunicano e fanno affari il 4 ottobre a San Francisco, in California.

Registrati qui

Il nuovo Make-A-Video di Meta è un segno che il prossimo passo dell’IA generativa, il text-to-video, sta per diventare mainstream? Data l’assoluta velocità dell’evoluzione da testo a immagine quest’anno – Midjourney ha persino creato polemiche con un’immagine che ha vinto un concorso artistico alla Colorado State Fair – sembra certamente possibile. Un paio di settimane fa, la società di software di editing video Runway ha rilasciato un video promozionale che prende in giro una nuova funzionalità del suo editor video basato su Web basato sull’intelligenza artificiale in grado di modificare video da descrizioni scritte.

Make A Video di Meta sfrutta l’intelligenza artificiale per portare la tua immaginazione nel video.

E la richiesta di generatori di testo in video al livello delle odierne opzioni di testo in immagine è elevata, grazie alla necessità di contenuti video su tutti i canali, dalla pubblicità sui social media e dai blog video ai video esplicativi.

Meta, da parte sua, sembra fiduciosa, secondo il suo documento di ricerca che introduce Make-A-Video: “In tutti gli aspetti, rivoluzione spaziale e temporale, fedeltà al testo e qualità, presentiamo risultati all’avanguardia nel testo -to-video generazione, come determinato da misure sia qualitative che quantitative.”

La missione di VentureBeat deve essere una piazza cittadina digitale per i decisori tecnici per acquisire conoscenze sulla tecnologia aziendale trasformativa e le transazioni. Scopri i nostri Briefing.