Midjourney, DALL-E, ces générateurs d’images ne vous sont peut-être pas inconnus. Et pour cause, nous entendons fréquemment parler de ces intelligences artificielles autour de nous. Leur fonction ? Générer des images à partir de requêtes (ou prompts) écrites par l’utilisateur. Mais alors, doivent-elles être considérées comme des outils d’aide à la création comme l’est ChatGPT ? Qui sont-elles et quels sont leurs enjeux pour les professionnels ? Faisons le point sur ces technologies émergentes.
Qu’est-ce que la génération d’images par l’IA ?
Aujourd’hui, tout le monde a accès aux générateurs d’images par IA. Leur processus de création semble presque magique, mais bien sûr et comme pour tout programme informatique, une technologie bien précise se cache derrière. Que ce soit pour le texte ou l’image, l’IA générative repose sur une suite d’algorithmes et le principe du machine learning. Ce dernier est très simple : il consiste à faire ingérer des informations existantes à l’IA pour qu’elle puisse ensuite générer un contenu unique.
Mais ce n’est pas tout : pour que la génération d’images soit qualitative et un minimum réaliste, la technologie va encore plus loin. D’autres outils comme la reconnaissance d’images ou encore les réseaux de neurones génératifs (aussi connus sous l’acronyme GAN) permettent de générer en quelques instants un contenu semblable à une véritable photographie.
Grâce à ces capacités, il est possible d’envoyer à peu près n’importe quelle requête à l’IA : un chat conduisant un vélo, le compositeur baroque Vivaldi jouant de la guitare électrique… Du moment que les règles d’éthique qu’elle intègre ne sont pas transgressées, la machine semble n’avoir que pour seule limite l’imagination des utilisateurs.
Quels sont les générateurs d’images les plus connus?
Très relayés par les médias, trois outils de génération d’images par l’IA font en ce moment beaucoup parler d’eux. Bien sûr, il en existe d’autres, mais ceux-ci sont régulièrement considérés comme les plus performants dans leur catégorie.
Midjourney, une IA aux rendus détaillés
Si vous êtes à la recherche de hautes performances, l’outil Midjourney est fait pour vous. Au départ disponible en freemium, cette IA a rapidement été victime de son succès et n’est aujourd’hui que disponible aux utilisateurs premiums. Pour l’utiliser, il vous suffit d’installer l’application de messagerie instantanée Discord puis de rejoindre le serveur dédié au logiciel. Vous pouvez alors vous abonner à ses services afin d’accéder à ses fonctionnalités.
Générations d’images photographiques, d’œuvres d’art en fonction d’un style précis, de zooms pour observer un objet dans le détail ou encore d’un univers fantastique, Midjourney sait à peu près répondre à tous les prompts sans grand défaut apparent. Une performance qui ne cesse d’impressionner !
DALL-E, une option plus accessible
Issue d’OpenAI, l’entreprise connue pour ChatGPT, DALL-E est une IA générative qui fonctionne sur un système de crédits. Chaque prompt que vous envoyez à la machine doit donc être bien réfléchi en amont ! Si votre utilisation de la génération d’images est plutôt occasionnelle, il s’agit d’une excellente alternative à Midjourney puisque les crédits achetés peuvent être conservés jusqu’à 12 mois. Pour vous en servir, rendez-vous sur le site officiel d’OpenAI et sélectionnez « Try DALL-E ».
Depuis sa nouvelle version nommée DALL-E 2, l’outil est capable de générer des images bien plus techniques et réalistes qu’auparavant. Plus créative grâce à l’intégration de paramètres enrichis, cette IA fait sans aucun doute partie des plus prometteuses pour l’avenir de la génération d’images.
Stable Diffusion, une alternative open-source
Gratuit et open-source : voici les principaux avantages de Stable Diffusion sur sa concurrence. Créé par l’Université de Munich, ce logiciel est accessible, modifiable et hébergeable par n’importe quel utilisateur. En tant que telles, les performances de la machine pour générer des images sont plus limitées que ses deux autres concurrents. Par exemple, il n’est pas rare de voir apparaître un troisième bras sur la représentation d’un être humain, ou encore des mains et des yeux déformés.
Cependant, c’est justement là qu’intervient l’aspect open-source ! Cet avantage permet de personnaliser l’image générée à sa guise ou encore d’intégrer d’autres fonctionnalités à l’IA. Si vous avez des notions de graphisme et de code, vous pouvez ainsi complètement vous approprier le logiciel et obtenir des rendus fidèles à ce que vous imaginez.
Pourquoi s’inquiéter des générateurs d’images par IA ?
Tout comme ChatGPT inquiète pour ses capacités rédactionnelles, les générateurs d’images par IA peuvent se présenter comme de potentielles menaces pour les métiers artistiques, du design ou de la communication. Des idées de graphisme à la confection de spots publicitaires, ces machines font d’ores et déjà preuve de capacités époustouflantes qui interrogent la chronique.
Si quelques incohérences peuvent nous faire deviner qu’une IA en est l’autrice, certaines images générées sont confondues avec des créations humaines. De plus, puisqu’elles reposent sur le principe du machine learning, les plus pessimistes peuvent penser que ces erreurs disparaîtront complètement dans les années à venir. À ce moment-là, comment pourrons-nous distinguer le vrai du faux ?
Pourquoi l’IA ne remplacera jamais le professionnel ?
Rassurez-vous : ce scénario de remplacement n’est pas prêt d’arriver. Et pour cause, les intelligences artificielles sont loin d’égaler les capacités humaines ! Plutôt que d’adopter une posture alarmiste, il est donc plus intéressant pour les professionnels de comprendre dès maintenant les avantages que leur offrent les générateurs d’images. Au même titre que ChatGPT, qui accompagne la rédaction web et fait évoluer ses missions, les outils comme Midjourney ou DALL-E sont parfaitement capables d’épauler la création d’images et de designs.
Grâce aux technologies de pointe utilisées, certaines tâches répétitives et fastidieuses peuvent aujourd’hui être automatisées. Par exemple en médecine, la génération d’images par l’IA peut être utilisée pour aider à la représentation visuelle de symptômes chez le patient.
Pour les artistes, les webdesigners ou tout autre métier touchant à la création d’image, il s’agit d’une opportunité à saisir impérativement ! Grâce à l’automatisation par l’IA, il devient possible de se concentrer sur des missions plus intéressantes, qui demandent créativité et rigueur. Telle qu’elle, la machine est perfectible et risque de le rester : c’est à l’humain de savoir s’en servir avec discernement pour en exploiter le plein potentiel.
Crédits photo : Midjourney, DALL-E et Stable Diffusion