Les Generative Adversarial Networks expliqués simplement

Un Generative Adversarial Network (GAN), ou en français réseau antagoniste génératif, est un modèle moderne de Machine Learning qui utilise deux réseaux neuronaux pour générer des données synthétiques réalistes. Les Réseaux Antagonistes Génératifs (GAN) peuvent créer des images, des textes et même de la musique. Les domaines d’application de ce concept vont de la création d’images et de vidéos à l’augmentation des données, en passant par l’art et le design.

20250113_SEO_DG_Inside_AI_Model_Hub_free_Desktop-960x320__FR.png
20250113_SEO_DG_Inside_AI_Model_Hub_free_Mobile-300x250__FR.png

Que signifie Generative Adversarial Network ?

Un Generative Adversarial Network ou GAN, est un framework pour la génération de données synthétiques dans le domaine du Machine Learning principalement utilisé pour entraîner des réseaux dans le cadre de l’apprentissage non supervisé. Le modèle d’apprentissage se compose de deux réseaux neuronaux artificiels, le générateur et le discriminateur qui travaillent en concurrence :

  • Générateur : la tâche du générateur consiste à créer de nouvelles instances de données qui sont trompeuses, c’est-à-dire qui ressemblent le plus possible au jeu de données original. Le réseau neuronal génératif démarre avec un bruit aléatoire et réalise des améliorations continues grâce à l’entraînement. Le générateur apprend à projeter un vecteur de variables latentes dans un espace de résultats spécifique, générant ainsi des résultats selon une distribution donnée. L’objectif final du réseau génératif est de créer des données artificielles capables de tromper le discriminateur.
  • Discriminateur : ce réseau est entraîné avec l’aide d’un ensemble de données connu, à distinguer les données authentiques des données synthétiques, jusqu’à ce qu’il atteigne une précision acceptable. Le discriminateur évalue ensuite l’authenticité des jeux de données qui lui sont présentés. En d’autres termes, il détermine si les instances de données fournies peuvent être attribuées au jeu de données original ou si elles constituent une contrefaçon.

L’entraînement de ces réseaux concurrents se fait simultanément. Le générateur affronte le discriminateur jusqu’à ce qu’il produise des données que ce dernier ne reconnaît plus comme étant des faux. Grâce à une rétropropagation des erreurs (backpropagation), les poids des deux réseaux sont optimisés à chaque étape d’entraînement. Cette méthode permet aux deux réseaux neuronaux de s’améliorer mutuellement de manière continue, ce qui fait que la distribution générée s’ajuste à celle des données réelles avec un temps d’entraînement suffisant. Une fois l’entraînement terminé, le générateur peut être utilisé pour produire des données artificielles à l’apparence réaliste.

Note

Les Generative Adversarial Networks ont d’abord été utilisés exclusivement comme modèle pour l’apprentissage non supervisé mais depuis, ils ont également fait leurs preuves pour l’apprentissage semi-supervisé, l’apprentissage supervisé et l’apprentissage par renforcement.

Les GAN par rapport à d’autres modèles d’apprentissage automatique

Les Generative Adversarial Networks (GAN) se distinguent à plusieurs égards des autres méthodes d’apprentissage automatique. Ils agissent comme des modèles génératifs implicites, ce qui signifie qu’ils ne modélisent ni une fonction de vraisemblance directe (likelihood function) ni ne fournissent de moyens pour trouver la variable latente. Au lieu de cela, les Generative Adversarial Networks génèrent de nouvelles instances de données par la concurrence à laquelle se livrent les deux réseaux concurrents.

Contrairement à d’autres approches qui génèrent des données par étapes, les GAN parviennent à créer un échantillon complet en un seul passage. De plus, il n’y a pas de restrictions quant au type de la fonction utilisée par le réseau.

Outils d'IA
Exploitez toute la puissance de l'intelligence artificielle
  • Créez votre site Web en un temps record
  • Boostez votre activité grâce au marketing par IA
  • Gagnez du temps et obtenez de meilleurs résultats

Le processus d’entraînement : comment fonctionnent les Generative Adversarial Networks ?

Le processus d’entraînement pour les Generative Adversarial Networks se compose de plusieurs étapes. L’aperçu suivant illustre en détail le déroulement de l’entraînement des GAN :

  1. Initialisation : dans un premier temps, les deux réseaux neuronaux (le générateur et le discriminateur) sont créés et initialisés avec des paramètres aléatoires.
  2. Génération de données fictives : le générateur reçoit en entrée un vecteur aléatoire qu’il utilise pour créer des données synthétiques. En raison du manque d’entraînement, la sortie ressemble au début à du bruit.
  3. Évaluation par le discriminateur : le discriminateur reçoit à la fois des échantillons de données authentiques et des ensembles de données générés par le générateur. Sa tâche consiste à distinguer les données authentiques des données falsifiées. Toutefois, le discriminateur doit lui aussi être entraîné pour pouvoir travailler avec précision. Cela signifie que ce réseau démarre également avec une sortie imprécise.
  4. Feedback et mise à jour des poids : les paramètres des deux réseaux sont ajustés par rétropropagation. Tandis que le générateur apprend à produire des données plus réalistes, le discriminateur améliore sa capacité à distinguer les instances de données réelles des instances de données artificielles.
  5. Itération : le Generative Adversarial Network répète les étapes 2, 3 et 4 jusqu’à ce que le générateur produise des données si réalistes que le discriminateur ne peut plus les reconnaître de manière fiable comme étant synthétiques ou jusqu’à ce que le modèle ait atteint la qualité souhaitée.

Les domaines d’application : dans quels contextes les GAN sont-ils utilisés ?

Les Generative Adversarial Networks, qui appartiennent au domaine de l’intelligence artificielle sont déjà utilisés avec succès dans différents secteurs. Les principaux domaines d‘application sont les suivants :

  • Génération d’images et de vidéos : les Generative Adversarial Networks sont principalement utilisés dans la production de films et le développement de jeux pour créer des images et des séquences vidéo hautement réalistes. Cette capacité permet également aux entreprises de mieux représenter leurs produits et services, comme des chaussures ou des vêtements. Les GAN sont également utilisés pour créer des environnements virtuels.
  • Médecine : dans le domaine de l’imagerie médicale, les GAN sont utilisés pour former des médecins et améliorer les procédures de diagnostic. En raison des préoccupations liées à la confidentialité, il est souvent difficile pour les chercheurs d’accéder à des images médicales à des fins de recherche. Les Generative Adversarial Networks sont désormais utilisés pour remédier à ce problème.
  • Data Augmentation : le framework peut être utilisé pour fournir des données d’entraînement supplémentaires pour les modèles de Machine Learning. Cela s’avère particulièrement pratique dans les situations où il n’existe que peu d’exemples réels.
  • Reconnaissance et synthèse vocale : les GAN sont utilisés pour générer du langage naturel et optimiser les systèmes de synthèse vocale. Contrairement aux implémentations audio et vocales conventionnelles, les Generative Adversarial Networks sont capables de générer de nouveaux échantillons.
  • Science : dans le monde scientifique, les Generative Adversarial Networks apportent également un soutien précieux. Ils permettent notamment de reconstruire des champs de vitesse et des champs scalaires dans des flux turbulents. Ce framework a également été utilisé pour générer de nouvelles molécules ciblant de nombreuses protéines liées à des conditions telles que l’inflammation, le cancer et la fibrose.
  • Art et design : les artistes et les designers utilisent les architectures des GAN pour créer des œuvres d’art et des designs innovants.

Avantages et inconvénients des Generative Adversarial Networks

Les Generative Adversarial Networks ouvrent des possibilités impressionnantes en matière de génération de données artificielles réalistes, notamment dans les domaines de la création d’images et de vidéos. Un grand avantage des GAN est leur capacité à générer des données de haute qualité sans modèles de probabilité explicites, ce qui les distingue de nombreux autres modèles d’apprentissage génératif. De plus, une multitude de fonctionnalités peut être intégrée au modèle, ouvrant ainsi la voie à un large éventail de scénarios d’application.

Un problème central réside cependant dans la stabilité du processus d’entraînement. Pendant l’entraînement, il existe un risque d’effondrement du mode ce qui entraîne une production par le générateur d’une diversité de données très limitée. Le problème survient surtout lorsque le générateur est entraîné trop souvent sans que le discriminateur ne soit mis à jour. De plus, il existe un risque que les GAN soient détournés à des fins malveillantes, comme la création de deepfakes réalistes pour semer la désinformation ou commettre des vols d’identité.

Avantages Inconvénients
Des données de haute qualité Processus d’entraînement instable
Modèle flexible Également intéressant à des fins malveillantes (deepfakes, etc.)
Adapté à de nombreux types d’applications
Cet article vous a-t-il été utile ?
Page top