Dans l’univers en constante évolution de l’intelligence artificielle (IA), Stability AI vient de franchir une nouvelle étape avec le lancement de Stable Cascade, une avancée significative par rapport à son modèle précurseur, Stable Diffusion. Cet outil de dernière génération prétend redéfinir les standards du marché avec des performances et une vitesse supérieures, marquant ainsi un tournant dans la génération d’images par IA.
Stable Cascade se distingue par sa capacité à générer des images avec une précision et une variation inédites. Il peut non seulement créer des images à partir de zéro mais aussi améliorer la résolution d’images existantes. Plus encore, il introduit des fonctionnalités d’édition avancées comme l’inpainting et l’outpainting, permettant de modifier des sections spécifiques d’une image, ainsi que Canny Edge, qui transforme les contours d’une photo en une toute nouvelle image.
Un exemple fascinant de sa capacité est la création d’une image captivante à la demande : « Photo cinématographique d’un pingouin anthropomorphe assis dans un café, lisant un livre tout en prenant un café ». Pour les chercheurs et les enthousiastes de l’IA, cette réalisation est accessible sur GitHub, bien que son usage reste limité à des fins non commerciales pour le moment. Cette limitation survient dans un contexte où de grandes entreprises telles que Google et Apple développent également leurs outils de création d’images par IA.
Au cœur de Stable Cascade, on trouve une innovation technique : au lieu d’employer un grand modèle de langue unique, cette approche utilise trois modèles distincts basés sur l’architecture Würstchen. Cette méthode consiste à compresser les invites textuelles en codes latents plus petits, qui sont ensuite traités pour générer l’image finale. Cette stratégie permet non seulement d’économiser de la mémoire mais également de réduire les temps de traitement, passant de 22 secondes avec le modèle antérieur SDXL à une remarquable rapidité de 10 secondes pour générer une image, offrant ainsi une qualité et une efficacité améliorées.
Cependant, le parcours de Stability AI n’est pas dépourvu de controverses, notamment en raison de poursuites liées à l’utilisation de données protégées par des droits d’auteur sans l’approbation des ayants droit. Une affaire notable est celle intentée par Getty Images, prévue pour décision en décembre. Malgré ces défis, Stability AI a initié la commercialisation de licences via un modèle d’abonnement dès décembre, une démarche destinée à soutenir financièrement ses activités de recherche.
À travers ces développements, Stability AI ne cesse de marquer l’industrie de l’IA, en popularisant la méthode de diffusion stable et en repoussant les limites de la technologie de génération d’images. Stable Cascade incarne non seulement l’innovation continue dans le domaine mais soulève également des questions cruciales sur l’éthique de la collecte de données et l’utilisation de l’IA.
- Des problèmes de « hallucinations » détectés dans l’outil de transcription Whisper d’OpenAI, rapportent les chercheurs. - octobre 27, 2024
- SandboxAQ d’Eric Schmidt envisage une valorisation de 5 milliards de dollars pour son projet audacieux lié à l’IA et à l’informatique quantique de Google. - octobre 19, 2024
- Les caractéristiques d’Apple Intelligence peuvent aussi synthétiser pour vous les textes de séparation - octobre 11, 2024