Les générateurs d'images par IA bientôt capables de s'adapter au monde réel
Les générateurs d'images par IA bientôt capables de s'adapter au monde réel
Créer une image à partir d'un texte est devenu une pratique très populaire avec l'essor de l'IA. Mais ces programmes restent imparfaits, car incapables d'apprendre après leur période d'entraînement. Une étape essentielle pour rester pertinent.
Pour développer un jumeau numérique, il est important de toujours savoir s'adapter aux changements dans le monde réel afin de rester pertinent. Une tâche réalisable grâce à l'intelligence artificielle, mais qui nécessite une importante quantité de données.
Une équipe de chercheurs israéliens espère contourner ce problème grâce à une méthode nommée ReFACT. «Notre objectif est de développer un outil qui met à jour de manière exacte et efficace les données des générateurs d'images par IA, détaille la principale autrice, Dana Arad, chercheuse à l'Université Technion, en Israël. Habituellement, de telles mises à jour réclament un suivi constant et un entraînement permanent pour que les IA s'adaptent.»
Par exemple, un algorithme va savoir reconnaître la tour Eiffel. Mais elle aura besoin d'être corrigée pour déterminer qui est le président d'un pays en cas de changement, ou encore quel est le logo d'une nouvelle marque. ReFACT va donc aller cibler la partie spécifique à modifier sans prendre en compte l'entièreté du modèle, ce qui modifie au final seulement 0,25% des paramètres de l'algorithme. Une approche beaucoup plus économique en termes de quantité de données, mais aussi plus rapide et plus fiable que les laborieux entraînements assurés par les utilisateurs. Concrètement, si une personne jusque-là inconnue devient quelqu'un de premier plan, le processus va être d'abord l'introduire en utilisant Dreambooth, une méthode de personnalisation développée par Google. Puis, cette personne va être ciblée pour les corrections à faire, afin que toutes les requêtes liées à elle soient mises à jour sans pour autant bouleverser tout l'algorithme.
Vers une intégration des jumeaux numériques ?
Pour l'instant, les auteurs ne se sont concentrés que sur les générateurs d'images, mais leur modèle pourrait explorer d'autres pans de l'intelligence artificielle. «Les jumeaux numériques pourraient être intégrés, assure la chercheuse. Ce sont des représentations virtuelles d'entités réelles, donc elles pourraient être corrigées avec ReFACT pour être plus précises et plus réalistes.» Une manière d'avoir un jumeau numérique qui s'adapterait constamment aux données issues de la réalité. Facile à dire, mais le chemin est long. «Parfois, une modification peut mener à plusieurs réponses plausibles, nuance Dana Arad. Par exemple, si on corrige en disant que tous les arbres ont les feuilles violettes, de quelle couleur seront-elles en automne? Il faut faire attention que les réponses soient cohérentes et logiques. C'est crucial pour que ces outils soient utilisés par la majorité.»
Du reste, les progrès réalisés avec ReFACT sont prometteurs, car les modifications effectuées ainsi sont plus efficaces que les autres programmes similaires. Par exemple, TIME qui fonctionne sur le même principe, modifie tout de même 1,95% des paramètres du modèle, mais se concentre sur d'autres dimensions plus éthiques comme les atteintes au copyright ou les contenus offensants. Au final le jumeau numérique devrait bénéficier de cette capacité d'adaptation croissante des générateurs par intelligence artificielle.
Lien vers le PDF de l'étude : https://aclanthology.org/2024.naacl-long.140/