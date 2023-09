Mais rien de tel qu’un exemple concret. Ici, un réalisateur de Los Angeles Jon Finger teste l’outil d’une façon plutôt concluante avec le français et l’allemand. Le bruit de fond d’une route passante toute proche a même été supprimé.

Un visage plus clair et lisse ? Une voix un peu robotique ? Peut-être, mais vous remarquerez la justesse du timbre et des intonations. HeyGen se base sur des données issues de véritables doubleurs. Ce qui donne, soulignons-le, un très léger accent québécois aux traductions françaises.

10 langues “input”, 8 langues “output”

L’application HeyGen développée par la start-up du même nom (anciennement Movio.la) a été dévoilée sous sa forme bêta en juillet 2022. À l’époque, elle permettait de générer des vidéos sur-mesure et sans aucune compétence de montage grâce à l’IA. Le principe était simple : écrire un script, choisir une voix et laisser un avatar en 3D dicter le texte. Les créateurs et professionnels du marketing pouvaient ainsi économiser des heures en tournage.

Or, il y a moins d’un mois, la jeune pousse a ajouté une fonctionnalité de doublage encore plus révolutionnaire. “Avec l’IA, on savait déjà faire de la transcription, du changement de voix et de l’ajustement des lèvres. Mais ce qui est magique ici, c’est d’avoir les trois en même temps dans une vidéo traitée en quelques minutes”, pointe Louis Gheysens, CEO de StoryMe, agence de marketing video à Bruxelles et spécialiste de l’IA.

Aujourd’hui, HeyGen est capable de traiter les paroles de n’importe quelle personne qui s’exprime dans une vidéo pendant au moins 30 secondes et jusqu’à cinq minutes, dans les langues “input” suivantes : français, anglais, espagnol, allemand, italien, portugais, néerlandais, chinois, japonais et indien. La voix du locuteur est clonée et le mouvement de ses lèvres modifié pour coller à la langue de destination choisie. Pour l’instant, l’application peut générer des traductions (”output”) en français, anglais, espagnol, allemand, italien, portugais, polonais et indien.

HeyGen offre aux utilisateurs jusqu’à deux minutes de vidéo gratuites après leur inscription. Ensuite, le service est proposé à partir de 27 euros par mois, ce qui donne également accès aux avatars virtuels.

Des métiers en perdition ?

Alors HeyGen, menace ou pas en avant ? “La semaine dernière, nous avons perdu un client qui il y a quatre mois nous avait payé 20 000 euros pour faire la traduction d’une centaine de vidéos, raconte Louis Gheysens. La raison ? Il a trouvé une offre pour trois fois moins cher chez un concurrent. C’est là que nous avons découvert la nouvelle fonctionnalité de HeyGen. Nous l’avons testée comme nous le faisons avec de très nombreuses intelligences artificielles. Ce qui est sûr, c’est que nous allons devoir répondre à une nouvelle réalité du marché et utiliser cet outil pour casser les prix et redevenir compétitifs.”

La menace pèse également sur l’avenir des traducteurs et des spécialistes du doublage et voix off. “C’est catastrophique pour eux. Les voix off se rendent compte que leur métier est fini. Je pense hélas que ces professions vont disparaître, ou alors très fortement changer, s’alarme le CEO de StoryMe. Certes, les voix issues de l’IA sont encore un peu robotisées. Mais HeyGen est arrivé à ce résultat en quelques mois. Imaginez ce qu’il en sera dans cinq ans…”

En juin dernier déjà, une vingtaine de syndicats et d’organisations syndicales d’Europe, des Etats-Unis et d’Amérique latine avaient créé l’United voices organisation (UVO), afin de militer pour une législation harmonisant l’IA et la création humaine. Leur slogan : “Ne volez pas nos voix”.

Toujours plus de fake news ?

De plus, le nouvel outil de HeyGen n’est-il pas synonyme de démultiplication des fake news ? “Personnellement, cela me fait très peur, assène Louis Gheysens. Déjà sans, le problème des fausses informations est bien ancré. Mais maintenant, on peut littéralement mettre n’importe quelles paroles sur les lèvres de n’importe qui sans que cela se voit. Il y aura toujours des personnes malveillantes et de mauvaises utilisations. Le monde va devoir s’adapter, créer des barrières plus fortes. Pour moi, cela passe d’abord par l’éducation, c’est-à-dire apprendre à nos enfants à avoir une lecture critique d’un sujet et à ne pas tout avaler sans réfléchir.”

Meilleure compréhension entre les langues et les cultures

Par ailleurs, le progrès technologique a tout de même ses avantages. Le fait de traduire des vidéos de manière simple et rapide accélère la capacité de compréhension entre les différentes langues et cultures. Par exemple, dans le cadre d’une situation d’urgence internationale comme une catastrophe naturelle ou une guerre, l’outil peut permettre de communiquer simplement et quasi en direct à toutes les nationalités concernées. “Chez StoryMe, nous faisons beaucoup d’employer branding dans le cadre du recrutement des entreprises, illustre Louis Gheysens. Avec HeyGen, le CEO notamment d’une multinationale peut s’adresser directement à ses différents interlocuteurs à travers le monde, et ce d’une manière davantage personnalisée car dans la bonne langue.” D’autre part, le fait de pouvoir s’exprimer dans sa langue maternelle permet au locuteur d’être plus à l’aise, moins concentré sur les mots et la forme mais davantage sur le fond, afin de donner un discours plus percutant.

Finalement, avec des avancées si rapides, à quoi peut-on s’attendre ? “La start-up HeyGen a cela de particulier qu’elle possède sa propre technologie, donc personne ne sait ce qu’elle va sortir après, conclut Louis Gheysens. Ils vont forcément rajouter des langues et augmenter la rapidité de traduction. On peut aussi imaginer l’ajout de nuances et la possibilité d’adapter une vidéo manuellement. Un copywriter serait toujours un copywriter, mais son métier évoluerait vers une traduction en nuances, choisir tel ou tel mot pour orienter le texte, des onomatopées… La valeur ajoutée serait alors davantage dans la justesse de l’expression que dans la traduction elle-même.”