Accueil tuto ZastTranslate : traduire et doubler vos vidéos YouTube gratuitement avec l’IA en local zast J’ai passé beaucoup de temps à développer ZastTranslate, un outil open source qui permet de traduire et doubler vos vidéos avec clonage vocal par IA. Le tout fonctionne 100% en local sur votre PC via Pinokio. Il n’y a aucun cloud, aucune API payante, aucun abonnement rien que des outils open source. Pourquoi j’ai créé ZastTranslate Je fais des vidéos YouTube en français depuis un moment. Le problème c’est que l’audience francophone reste limitée. Si vous voulez toucher un public international, il faut doubler vos vidéos dans d’autres langues. J’ai testé pas mal de solutions : des services en ligne comme HeyGen. J’ai aussi testé des outils open source existants et à chaque fois j’avais le même problème : le décalage audio. Parce que le vrai casse-tête du doublage vidéo, c’est que l’audio traduit doit faire exactement la même durée que l’audio original. Si vous passez de l’anglais au français, les phrases françaises sont souvent plus longues. Du français vers l’anglais, c’est plus court. Et YouTube est très strict là-dessus : si la piste audio ne correspond pas à la durée de la vidéo, ça ne passe pas. C’est pour ça que j’ai développé ZastTranslate. Un outil qui gère automatiquement cette synchronisation. Pour le nom je n’avais pas d’idée :(. Comment fonctionne ZastTranslate L’interface est volontairement simple. Vous importez votre vidéo (soit par URL YouTube, soit en glissant un fichier local) et le logiciel fait le reste en plusieurs étapes. Séparation voix et musique La première étape utilise Demucs pour séparer la voix de la musique de fond et des effets sonores. C’est important parce que ça permet de conserver la bande sonore originale et de ne remplacer que la voix. Transcription automatique WhisperX transcrit ensuite tout ce qui est dit dans la vidéo avec des timestamps précis. Le modèle large-v3 donne les meilleurs résultats. La détection de la langue est automatique, vous n’avez pas besoin de la spécifier. Une fois la transcription terminée, vous pouvez la modifier directement dans l’interface si certaines phrases ne sont pas correctes. Vous pouvez aussi exporter le fichier SRT. Traduction en deux versions C’est la partie clé. Le LLM Qwen3-8B traduit le texte et génère deux versions : une traduction classique fidèle et une version raccourcie (fitted). La version raccourcie est calibrée pour rentrer dans la durée de chaque segment audio original. J’ai testé plein de LLM avant de me décider. C’est d’ailleurs pour ça que j’ai perdu autant de temps en développement. Au final Qwen3-8B donne les meilleurs résultats pour la traduction. Pour les sous-titres de vos vidéos, je vous conseille d’utiliser la version traduite complète. Pour le doublage audio, c’est la version raccourcie qui est utilisée. Synthèse vocale avec clonage Qwen3-TTS génère l’audio traduit. C’est pareil, j’ai utilisé plusieurs TTS avant de choisir celui-là et même revenir sur mes anciens commit Github ;). Vous avez deux options : une voix par défaut ou le clonage de votre propre voix. Je vous conseille vraiment le mode clone, c’est beaucoup plus naturel. Le résultat n’est pas parfait mais c’est franchement bluffant pour un outil gratuit qui tourne en local. Le système essaye ensuite de faire tenir l’audio dans le bon timing. Si c’est trop long par rapport au segment original, il ajuste. Il y a deux modes disponibles : soit on ne coupe jamais les phrases (le système se synchronise pendant les blancs), soit on autorise des coupes. Dans les deux cas, un rapport vous indique ce qui a été modifié. Je n’ai pas fait de lip-sync. Export final L’audio doublé est mixé avec la musique de fond originale et le tout est remonté sur la vidéo. Vous récupérez un fichier MP4 ou juste la piste audio (c’est ce qui m’intéresse personnellement pour l’uploader directement sur YouTube comme piste audio alternative). Les 10 langues supportées Qwen3-TTS gère 10 langues : anglais, espagnol, allemand, italien, portugais, chinois, japonais, coréen, russe et français. De français vers l’anglais, ça passe bien. D’anglais vers le français, c’est plus compliqué à cause de la longueur des phrases. Mais le système se débrouille. Configuration recommandée Il vous faut une carte graphique NVIDIA avec au minimum 8 Go de VRAM. Une RTX 4060 ou mieux fera l’affaire. Ça fonctionne aussi en CPU mais c’est beaucoup plus lent. Le logiciel tourne sur Windows mais cela devrait aussi fonctionner sur Linux et macOS via Pinokio.Voir aussizasttuto 31 janvier 2026 à 18h17Tuto LTX-2 : Comment générer des vidéos IA gratuitement sur votre PC avec Pinokio Comment installer ZastTranslate L’installation se fait via Pinokio en quelques clics. Si vous ne connaissez pas Pinokio, c’est un launcher open source qui simplifie l’installation d’applications IA. J’ai fait plusieurs vidéos sur le sujet, vous les retrouverez sur la chaîne du site. Dans Pinokio, allez dans la section Community et cherchez ZastTranslate. Cliquez sur Install et c’est parti. Soyez patients au premier lancement parce que les modèles IA font plusieurs gigas. Le code source est disponible sur GitHub (https://github.com/zast57/ZastTranslate). Pour l’instant ce que je peux dire de mon outil ZastTranslate n’est pas parfait. Il y a probablement encore des bugs et j’ai plein d’améliorations en tête. Mais pour un outil gratuit et open source qui tourne entièrement en local, le résultat est vraiment correct. J’utilise déjà l’outil pour doubler mes propres vidéos et les résultats sont suffisamment bons pour être publiés sur YouTube. Si vous faites du contenu vidéo et que vous voulez toucher un public international sans payer un abonnement mensuel, ça vaut le coup de tester. Le projet est en version 0.9 et j’ai encore des choses à améliorer mais chaque modification prend énormément de temps pour les tester. N’hésitez pas à me faire vos retours en commentaire sous la vidéo ou directement sur GitHub. La vidéo tuto complète de ZastTranslate J’ai fait une vidéo complète où je vous montre toutes les étapes : l’installation, l’import de vidéo, la transcription, la traduction, le doublage avec clonage vocal et l’upload sur YouTube. Je vous montre aussi des exemples concrets avec des versions doublées en anglais, allemand et espagnol.
zasttuto 31 janvier 2026 à 18h17Tuto LTX-2 : Comment générer des vidéos IA gratuitement sur votre PC avec Pinokio