L'intelligence artificielle progresse rapidement dans le domaine de la génération vidéo. Cela pourrait avoir un effet profond sur nos flux de médias sociaux un jour.
Siège social d'Alphabet Inc. à Mountain View, Californie.
Les capacités créatives de l'IA dépassent ses compétences de conduite. Alors que la technologie des voitures autonomes ne va nulle part , il y a eu une explosion remarquable de la recherche autour des modèles génératifs ou des systèmes d'intelligence artificielle capables de créer des images à partir d'un simple texte. Au cours de la semaine dernière, les chercheurs en intelligence artificielle de Meta Platforms Inc. et Google d'Alphabet Inc. ont fait un bond en avant extraordinaire en développant des systèmes capables de générer des vidéos avec à peu près n'importe quelle invite de texte imaginable.
Les vidéos de Meta, parent de Facebook, ressemblent à des séquences de rêve trippantes, montrant un ours en peluche peignant des fleurs ou un cheval aux jambes distendues galopant sur un champ. Ils durent environ une ou deux secondes et ont une qualité glitchy qui trahit leur source, mais ils sont toujours remarquables. Les vidéos générées par Google , de café versé dans une tasse ou d'un vol au-dessus d'une montagne enneigée, semblent particulièrement réalistes.
Google a également construit un deuxième système encore plus impressionnant appelé Phenaki qui peut créer des vidéos plus longues, d'une durée de deux minutes ou plus. Voici un exemple de l'invite utilisée par Google :
"Beaucoup de trafic dans la ville futuriste. Un vaisseau spatial extraterrestre arrive dans la ville futuriste. La caméra pénètre à l'intérieur du vaisseau spatial extraterrestre. La caméra avance jusqu'à montrer un astronaute dans la salle bleue. L'astronaute tape sur le clavier. La caméra s'éloigne de l'astronaute. L'astronaute quitte le clavier et marche vers la gauche…"
C'est moins d'un tiers de l'invite entière, qui se lit presque comme un script de film avec des commandes telles que "la caméra zoome".
Vous pensez peut-être que c'est la fin d'Hollywood tel que nous le connaissons ou que n'importe qui avec quelques cellules cérébrales et un ordinateur sera bientôt capable de produire des longs métrages. Cela correspond en fait à ce que les chercheurs espèrent. Erhan a tweeté que lui et son équipe voulaient donner aux gens les moyens de "créer leurs propres histoires visuelles… [pour] faciliter la créativité des gens".
Il est difficile de voir des vidéos générées par l'IA arriver dans votre cinéma local de si tôt. Mais nous les verrons presque certainement être publiés dans nos flux de médias sociaux, en particulier sur des plateformes comme TikTok de ByteDance Ltd., Reels d'Instagram ou YouTube.
TikTok n'a pas répondu à la question de savoir s'il construisait son propre outil de génération de vidéo AI, mais il serait logique que la plate-forme le fasse. Les utilisateurs de TikTok adorent ajouter des autocollants, du texte et des écrans verts à leurs publications, et la plate-forme répond à la demande avec de nouvelles technologies. En août, il a ajouté un générateur d'images AI à son application pour créer des écrans verts stylisés. Tapez une invite comme "Boris Johnson" et TikTok fera apparaître une image abstraite rappelant vaguement l'ancien Premier ministre britannique.
Que se passe-t-il lorsque les machines recommandent non seulement les vidéos qui nous font défiler, mais participent également davantage à leur création ? Beaucoup d'entre nous aiment regarder des images de chats mignons et de personnes qui trébuchent sur eux-mêmes, donc un algorithme qui pourrait produire de faux montages de trébuchements maladroits ou de chatons fringants attirerait des succès viraux avec peu de travail, tant qu'ils semblent réels.
Les créateurs de contenu sur TikTok, et les plateformes elles-mêmes, ont tout intérêt à exploiter un outil capable de générer des vidéos à grande échelle, surtout lorsqu'il est bon marché et facile. Pour le reste d'entre nous, le résultat serait des flux de médias sociaux plus automatisés que jamais. Déjà alimentées par l'IA et les algorithmes de recommandation, les vidéos d'IA s'ajouteraient aux boucles de rétroaction auto-renforcées qui grattent nos démangeaisons cognitives.
L'autre conséquence imminente est un flot de désinformation, mais il y a peut-être moins lieu de s'alarmer à court terme. Les plates-formes de médias sociaux ont intensifié leurs efforts pour éliminer les faux contenus, et Google et Facebook refusent de divulguer leurs outils de création de vidéos au public en raison du potentiel d'utilisation abusive (et vraisemblablement de mauvaises relations publiques). Google a déclaré que son propre système générait des vidéos biaisées contre les femmes, même lorsqu'elles essayaient de filtrer les résultats stéréotypés. Le modèle ou son code source ne seront pas publiés tant que le problème ne sera pas résolu, ont déclaré les chercheurs de Google.
Bien sûr, vous pourrez bientôt utiliser ces outils avec peu de restrictions, grâce à des organisations comme Stability AI. La startup britannique a publié en août dernier un outil de génération d'images qui permettait à quiconque de générer de l'art cool, ainsi que de fausses photos de célébrités, de politiciens et de zones de guerre, ce que les grandes entreprises d'IA ont interdit. J'ai essayé l'outil et, en quelques secondes, j'ai pu concocter des photos de l'ancien président Donald Trump jouant au golf avec le leader nord-coréen Kim Jong Un. Stability travaille sur un outil de génération vidéo qu'il prévoit de publier publiquement lorsqu'il sera prêt.
Mais alors qu'un meilleur accès à ces outils conduira à plus de faux contenus, cela signifiera également que plus de gens sont conscients que les outils existent. Ils sont plus susceptibles de soupçonner que la "photo" du président Joe Biden frappant une vieille dame est générée par l'IA. C'est l'espoir, en tout cas.
Tout aussi inquiétant est ce que ces outils feront sur le régime alimentaire quotidien des gens. Les chercheurs de Google affirment que leurs outils augmenteront la créativité humaine. Mais quand il devient si facile de faire de la vidéo qu'il faut à peine y penser, est-ce que cela exploite vraiment notre imagination ? Peut-être pas dans tous les cas.
Couplé aux moteurs de recommandation qui génèrent une grande partie de ce que nous avons vu en ligne, orientés vers la génération de clics, cela rend notre avenir beaucoup plus dirigé par la machine – et, sans doute, pas très créatif.
L’intelligence artificielle progresse rapidement dans le domaine de la génération vidéo. Cela pourrait avoir un effet profond sur nos flux de médias sociaux un jour. Siège social d’Alphabet Inc. à Mountain View, Californie. Les capacités créatives de l’IA dépassent ses compétences de conduite.
L’intelligence artificielle progresse rapidement dans le domaine de la génération vidéo. Cela pourrait avoir un effet profond sur nos flux de médias sociaux un jour. Siège social d’Alphabet Inc. à Mountain View, Californie. Les capacités créatives de l’IA dépassent ses compétences de conduite.
L’intelligence artificielle progresse rapidement dans le domaine de la génération vidéo. Cela pourrait avoir un effet profond sur nos flux de médias sociaux un jour. Siège social d’Alphabet Inc. à Mountain View, Californie. Les capacités créatives de l’IA dépassent ses compétences de conduite.