Aller au contenu principal
Passer de consommateur à builder · 9 min de lecture ·

Cloner sa voix et son visage avec l'IA : HeyGen + Eleven Labs

Comment cloner son visage avec HeyGen et sa voix avec Eleven Labs, puis automatiser la création de vidéos IA avec Make et ChatGPT.

Shubham Sharma
Shubham Sharma
· Mis à jour le

Créer un clone vidéo et vocal de soi-même, puis automatiser la production

Vous pouvez aujourd’hui cloner votre visage et votre voix avec l’IA, puis automatiser la génération de vidéos personnalisées via Make et ChatGPT. Le tout en moins de 10 minutes de configuration. J’ai testé l’ensemble du pipeline et je vous détaille la méthode.

Le marché de la génération vidéo par IA pèse $788 millions en 2025 et devrait atteindre $3,44 milliards d’ici 2033, soit une croissance de 20% par an selon Grand View Research. On est au tout début.

La vidéo complète

Pourquoi le clonage vidéo par IA se démocratise

Les “instant avatars” de HeyGen ont bouleversé le marché du clonage vidéo en 2024. En enregistrant 2 minutes de vidéo face caméra, vous obtenez un clone numérique capable de reproduire votre visage, vos expressions et vos gestes.

HeyGen a levé $60 millions en Série A auprès de Benchmark, pour une valorisation de $500 millions. L’entreprise est passée de $1 million d’ARR à $35 millions en environ 15 mois (source : Contrary Research, 2024).

Cette croissance 35x en moins de deux ans traduit une demande réelle pour le clonage vidéo.

Le problème : HeyGen excelle sur le clonage visuel, mais sa synthèse vocale reste moyenne. La voix sonne artificielle, robotique. C’est là qu’Eleven Labs entre en jeu.

Eleven Labs : l’outil de référence pour le clonage vocal

Eleven Labs s’est imposé comme un acteur majeur de la synthèse vocale depuis début 2024. L’outil permet trois choses :

  • Text-to-speech : transformer du texte en parole avec n’importe quelle voix
  • Speech-to-speech : parler avec votre voix et faire parler quelqu’un d’autre
  • Clonage vocal : créer une réplique de votre voix à partir de quelques échantillons audio

La qualité est nettement supérieure à ce que propose HeyGen ou ses concurrents comme Synthesia.

Eleven Labs a levé $180 millions en Série C en janvier 2025, pour une valorisation de $3,3 milliards (TechCrunch). La valorisation a été multipliée par 3 en 12 mois.

Comment cloner sa voix avec Eleven Labs

  1. Créer un compte sur Eleven Labs
  2. Aller dans la section “Voices” et cliquer sur “Clone”
  3. Uploadez entre 1 et 25 échantillons audio de votre voix
  4. Donnez un nom et une description à votre clone
  5. Tester le résultat avec du text-to-speech

Plus vous fournissez d’échantillons variés (ton joyeux, ton sérieux, débit rapide, débit lent), plus le clone sera fidèle.

Écosystème de clonage vidéo IA : HeyGen au centre connecté à Eleven Labs pour la voix, ChatGPT pour le texte, Make pour l'orchestration et VideoAsk pour l'input Écosystème complet — chaque outil apporte une brique, HeyGen assemble le résultat final.

Combiner HeyGen + Eleven Labs : le meilleur des deux mondes

HeyGen a compris qu’Eleven Labs était meilleur sur la voix. Ils proposent une intégration directe via clé API.

Comparaison avant-après HeyGen seul versus HeyGen combine avec Eleven Labs — synthese vocale, naturalite de la voix et text-to-speech passent de basique a quasi-humain HeyGen seul vs HeyGen + Eleven Labs — la voix fait toute la différence.

FonctionnalitéHeyGen seulHeyGen + Eleven Labs
Clone visuelExcellentExcellent
Synthèse vocaleMoyenneExcellente
Naturalité de la voixRobotiqueQuasi-humaine
Text-to-speechBasiqueAvancé (émotions, pauses)
Coût supplémentaireInclusAbonnement Eleven Labs

Étape 1 : Récupérer votre clé API Eleven Labs

Dans votre compte Eleven Labs, allez dans les paramètres et copiez votre clé API.

Étape 2 : L’intégrer dans HeyGen

Dans HeyGen, collez la clé API Eleven Labs dans les paramètres d’intégration. À partir de là, toutes les vidéos générées utiliseront la voix Eleven Labs.

Étape 3 : Tester le résultat

Tapez un texte dans l’interface HeyGen. Le clone visuel HeyGen parlera avec la voix clonée Eleven Labs. Le résultat est nettement plus naturel.

Automatiser la génération de vidéos avec Make et ChatGPT

C’est à cette étape que l’automatisation prend tout son sens. Au lieu de taper manuellement du texte à chaque vidéo, vous pouvez automatiser l’ensemble du pipeline.

Le schéma d’automatisation

  1. VideoAsk reçoit un témoignage vidéo ou audio
  2. VideoAsk transcrit automatiquement le message
  3. ChatGPT génère une réponse personnalisée à partir de la transcription
  4. L’API HeyGen crée une vidéo avec votre avatar qui dit la réponse
  5. La vidéo est envoyée automatiquement par email

Pipeline d'automatisation vidéo IA avec Make : VideoAsk reçoit un témoignage, ChatGPT génère la réponse, l'API HeyGen crée la vidéo avatar, envoi automatique par email Workflow Make complet — du témoignage reçu à la vidéo personnalisée envoyée, sans intervention manuelle.

Configuration dans Make

Le scénario Make se compose de 4 modules :

  • Module VideoAsk : écoute les nouveaux témoignages et récupère la transcription
  • Module OpenAI : envoie la transcription à ChatGPT avec un prompt qui définit le ton et la durée (~30 secondes)
  • Module HTTP (API HeyGen) : envoie le texte généré à l’API HeyGen pour créer la vidéo avec votre avatar
  • Module Email : envoie la vidéo générée au destinataire

HeyGen propose un module Make natif, mais il est payant. L’alternative : utiliser directement l’API HeyGen via un module HTTP dans Make.

“One of the greatest short-term concerns, but one that’s going to grow as we move forward toward more capable systems is disinformation, misinformation. […] We’ll have machines that can generate more realistic images, more realistic sounding imitations of voices, more realistic videos.” — Yoshua Bengio, prix Turing d’IA (CNBC)

Les risques du clonage IA : deepfakes et détection

Les progrès sont significatifs, mais ils posent des questions sérieuses.

Selon le rapport Sumsub 2024, les deepfakes ont été multipliés par 4 entre 2023 et 2024. Ils représentent désormais 7% de toutes les tentatives de fraude dans le monde.

Les pertes liées aux fraudes par IA générative devraient passer de $12,3 milliards en 2023 à $40 milliards d’ici 2027 selon Deloitte.

Le marché du clonage vocal atteint 2 milliards de dollars en 2024 et devrait peser 12,8 milliards d’ici 2033 (IMARC Group).

Quelques précautions à garder en tête :

  • Vérifiez l’identité lorsque vous recevez un audio ou une vidéo inattendue
  • Les clones ne sont pas encore parfaits : des micro-détails (mouvements de mains, expressions subtiles) trahissent encore l’IA
  • Les usages légitimes sont nombreux : traduction de contenu, support client, formation interne, personnalisation à grande échelle

Les cas d’usage concrets du clonage vidéo IA

  • Créateurs de contenu : traduire ses vidéos dans plusieurs langues automatiquement
  • Équipes support : générer des réponses vidéo personnalisées sans filmer
  • Formation : adapter le contenu de formation à chaque langue et chaque apprenant
  • Prospection : envoyer des vidéos IA personnalisées sur LinkedIn à grande échelle
  • Onboarding : accueillir chaque nouveau client avec une vidéo personnalisée

Si vous débutez avec l’automatisation, commencez par comprendre comment construire votre premier agent IA.

Et si vous vous sentez perdu face à tous ces outils, voici un système en 3 étapes pour avancer.

Mon avis : nous sommes au début d’une transformation majeure du contenu vidéo

Le clonage vidéo et vocal par IA n’est pas un gadget. C’est une évolution notable dans la manière de produire du contenu.

Après avoir généré une dizaine de vidéos avec ce pipeline, je constate que le résultat est déjà exploitable pour du support client ou de la traduction de contenu. On repère encore des artefacts visuels, des mouvements de lèvres légèrement décalés. Mais la vitesse de progression est vertigineuse.

D’ici quelques mois, distinguer une vraie vidéo d’un clone IA sera quasi-impossible pour un oeil non entraîné. Les outils comme HeyGen et Eleven Labs mettent cette technologie à la portée de tout le monde, pas seulement des studios de production.

Si vous souhaitez recevoir ce type de contenu chaque semaine, inscrivez-vous à la newsletter — un email par semaine, zéro spam.

Questions fréquentes

Comment cloner son visage en vidéo avec l'IA ?

HeyGen permet de créer un 'instant avatar' en enregistrant 2 minutes de vidéo face caméra. L'outil analyse votre visage, vos expressions et vos gestes pour générer un clone vidéo réaliste. Vous pouvez ensuite lui faire dire n'importe quel texte ou audio. HeyGen a levé 60 millions de dollars en 2024 et sert plus de 85 000 clients.

Quel est l'outil recommandé pour cloner sa voix avec l'IA ?

Eleven Labs s'est imposé comme un acteur majeur de la synthèse vocale en 2024-2025, valorisé à 3,3 milliards de dollars après sa Série C de 180 millions. Il permet le text-to-speech, le speech-to-speech et le clonage vocal à partir de quelques échantillons audio. Sa qualité dépasse largement celle intégrée dans HeyGen.

Peut-on combiner HeyGen et Eleven Labs ensemble ?

Oui. HeyGen propose une intégration directe d'Eleven Labs via API. Vous copiez votre clé API Eleven Labs dans les paramètres HeyGen, et la voix clonée d'Eleven Labs remplace celle native de HeyGen. Le résultat combine le meilleur des deux : clone visuel HeyGen + voix réaliste Eleven Labs.

Comment automatiser la création de vidéos IA avec Make ?

Vous connectez VideoAsk (réception de messages), ChatGPT (génération de réponse) et l'API HeyGen (création vidéo) dans un scénario Make. Quand quelqu'un laisse un témoignage sur VideoAsk, ChatGPT génère une réponse personnalisée, puis HeyGen crée automatiquement une vidéo avec votre avatar. Le tout sans intervention manuelle.

Les deepfakes vidéo sont-ils détectables en 2025 ?

De plus en plus difficilement. Selon le rapport Sumsub 2024, les deepfakes ont quadruplé en un an et représentent 7% des tentatives de fraude mondiales. Les pertes liées aux fraudes par IA générative devraient passer de 12,3 milliards de dollars en 2023 à 40 milliards d'ici 2027 selon Deloitte.

Un email concret. Chaque mardi.

Rejoins 52 000 abonnés. Un outil testé, un workflow à copier ou une méthode à appliquer — en 5 minutes de lecture.

Gratuit · Désinscription en un clic.