IA : de « Will Smith qui mange des pâtes » au photoréalisme d'OpenAI, la course au ChatGPT de la vidéo

Sora, 2 labradors en podcast

Il y a quelques jours, OpenAI, le créateur de ChatGPT, bluffait les internautes avec les productions de Sora, son nouveau modèle d'intelligence artificielle. Ces vidéos au rendu très réaliste ont vite été comparées à l'esthétique cauchemardesque des premières images générées à partir d'un simple texte, diffusées il y a un an. Retour sur les vidéos virales qui ont marqué la courte histoire de cette technologie.

Publié le 22-02-2024 par Marine Protais

En mars 2023, un Will Smith difforme mange goulument un plat de spaghetti qui semble ne jamais se vider. Cette vidéo étrange, presque cauchemardesque, étonne le Web. L'extrait original est publié d'abord sur un forum Reddit puis repartagé sur X (ex Twitter) où elle est vue plus près de 10 millions de fois. Elle devient en quelques jours le symbole des débuts de la vidéo générée par IA. Pour produire ces images, son créateur s'est servi d'un modèle d'IA hébergé sur Modelscope, la plateforme du chinois Alibaba lancée fin 2022.

Will Smith dévorant des spaghettis, le mètre étalon

Cet algorithme a été entraîné sur des millions d'images et des milliers de vidéos récupérées via des bases de données de référence comme ImageNet. La vidéo de 20 secondes met en fait bout à bout de très courtes vidéos de 2 secondes, précise le média Ars Technica. Le résultat rassure les internautes : si les images fixes générées par IA commencent à nous tromper -celle du Pape portant une doudoune blanche circule à la même période- la vidéo elle, par son rendu maladroit, n'en est pas là.


La fausse vidéo de Will Smith est devenue pour certains une sorte de mètre étalon pour évaluer les progrès de la technologie text-to-video. C'est-à-dire les algorithmes capables de produire des images animées à partir d'un simple prompt (un texte descriptif). Will Smith et ses spaghettis servent à compa

Lire la suite

Voir la suite...

Les dernières actualités