Après Dall-E et Midjourney, cette nouvelle IA permet de générer une vidéo à partir d’un texte

Il se pourrait bien que l’on tienne la première IA capable de générer des vidéos à partir d’un texte. Gen-2, un outil développé par Runway, fonctionne peu ou prou de la même manière que Midjourney et ses équivalents. Si pour l’heure, la technologie n’en est encore qu’à ses balbutiements, les résultats obtenus sont déjà fort impressionnants et promettent une véritable révolution dans le domaine de la vidéo.

Si les choses se sont particulièrement accélérées en ce début 2023 avec l’invasion de ChatGPT et de ses descendants, cela fait quelque temps maintenant qu’il est possible de générer des images par intelligence artificielle. Cette nouveauté a par ailleurs été la source de nombreuses polémiques, notamment autour de la question du droit d’auteur et de la protection des artistes. Pour autant, cela n’empêche pas les géants de la tech de se pencher très sérieusement sur la question, comme nous l’a récemment montré Microsoft avec son propre outil intégré à Bing.

Aujourd’hui donc, la génération d’images par IA est déjà à un stade relativement avancé. On ne peut pas en dire de même, en revanche, de la vidéo, fantasme forcément bien plus complexe à réaliser avec son lot de contraintes. La start-up Runway s'est malgré tout dévoué pour relever le défi, qui plus est avec une certaine réussite. En effet, cette dernière pourrait bien être à l’origine d’une (pas si) petite révolution dans le milieu de la vidéo.

Découvrez Gen-2, l’équivalent vidéo de Midjourney

Cette révolution a un nom : Gen-2. Cette IA arrive, comme son nom l’indique, après Gen-1, un outil lancé en février déjà capable de retoucher des vidéos et d’y appliquer des filtres à partir d’une commande texte. Gen-2, elle, va beaucoup plus loin, puisqu’elle est capable de générer entièrement une vidéo sans modèle préalable, simplement à partir d’une description de l’utilisateur.

Dans ses Modes 02 et 03, Gen-2 propose même d’ajouter une image à sa description pour coller au mieux au résultat attendu, voire de se passer complètement de texte et de se baser uniquement sur l’image. Les autres Modes, quant à eux, continuent le travail de Gen-1 en proposant diverses options de retouches vidéo.

Sur le même sujet : Netflix remplace ses artistes humains par une IA pour générer les décors d’un dessin animé

Certes, pour le moment les vidéos générées ne sont pas encore parfaites. Il est clairement visible que ces dernières ont été générées par IA, celle-ci ayant du mal à élaborer des images réalistes en grande quantité. Reste qu’arriver à ce niveau en seulement quelques mois est véritablement bluffant. Nul doute que Gen-2 va enclencher de profonds changements au sein de l’industrie.

Source : Runway

Voir les commentaires
Ailleurs sur le web