Sora, l’IA d’OpenAI qui fabrique des vidéos à partir de texte
OpenAI a dévoilé Sora, un modèle d’intelligence artificielle capable de générer des vidéos à partir d’une simple consigne écrite. Vous tapez une description, et l’outil produit une vidéo réaliste, parfois carrément imaginative, d’une minute maximum.
C’est un sacré bond par rapport à ce que faisait déjà la maison. Après DALL-E pour les images et ChatGPT pour le texte, OpenAI s’attaque cette fois à la vidéo, un terrain bien plus difficile à maîtriser.
Sora ne se contente pas de petites animations. Le modèle est présenté comme un outil capable de monter des scènes complexes, avec plusieurs personnages, des mouvements précis et des détails poussés sur les sujets comme sur les décors.
Pour le prouver, OpenAI a partagé des exemples. Dans l’un, une femme se promène dans une rue de Tokyo, avec un rendu soigné des lumières de la ville et des panneaux. Dans un autre, d’énormes mammouths laineux avancent dans la neige. De quoi donner une idée du niveau de réalisme visé.
OpenAI ne cache pas pour autant les limites du modèle. Sora a encore du mal à simuler correctement la physique d’une scène compliquée, ou à comprendre certains enchaînements de cause à effet. L’exemple donné parle de lui-même : une personne qui mord dans un cookie, sans que la fameuse trace de morsure apparaisse ensuite.
Si la génération d’images et de vidéos par IA vous tente côté création, un ouvrage dédié peut vous aider à y voir plus clair.
L’IA pour la créativité (livre) → voir sur Amazon
Lien affilié Amazon. En tant que Partenaire Amazon, je réalise un bénéfice sur les achats remplissant les conditions requises.
Malgré ces ratés, l’outil a marqué les esprits. Beaucoup y voient un futur compagnon pour les créateurs de contenu, voire un usage couplé à la réalité mixte pour des expériences immersives dignes d’un holodeck de science-fiction.
Qui dit vidéos générées par IA dit aussi risque de dérapage. OpenAI travaille donc sur la sécurité. L’entreprise développe des outils pour repérer les contenus trompeurs créés par Sora, et le modèle refuse déjà certaines demandes : violence extrême, images haineuses, ressemblances avec des célébrités et autres contenus problématiques.
Pour l’instant, Sora reste en phase de test. L’accès est réservé à un nombre limité d’artistes visuels, de designers et de cinéastes. L’objectif est de récolter leurs retours pour améliorer le modèle et le rendre vraiment utile aux professionnels de la création.
Difficile de dire aujourd’hui ce que ça donnera entre toutes les mains. Mais une chose est sûre : entre les usages créatifs réjouissants et les possibilités de manipulation, on n’a pas fini d’entendre parler de Sora.
Si la génération d’images et de vidéos par IA vous tente côté création, un ouvrage dédié peut vous aider à y voir plus clair.
Crédit photo : DR