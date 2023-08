“Il y a encore un an, je pouvais être sceptique à l’idée d’un doublage par une intelligence artificielle, confie en écho Stany Mannaert, acteur, chanteur et doubleur belge. Mais les choses s’accélèrent”. Stany Mannaert et Éléonore Meeùs forment un couple d’artistes de la voix – ceux qu’on appelle communément doubleurs. Ils sont environ quatre cents à en vivre de manière régulière en Belgique francophone.

Les clauses de confidentialité ne permettent pas aux deux interprètes de citer les œuvres auxquelles ils prêtent leur voix. Mais ils confient doubler des séries pour des plateformes. Cette activité est aujourd’hui menacée par l’émergence et le perfectionnement des IA.

En Belgique, ils sont désormais réunis au sein de la BelVA (Belgian Voice Artists). Il y a encore six mois, cette ASBL n’existait pas. Ses statuts seront déposés cette semaine. Il y a urgence, en effet…

Mobilisation internationale

”La mobilisation a commencé au printemps dernier”, explique Laetitia Liénart, comédienne et cofondatrice de la BelVA. “Les artistes de la voix se sont mobilisés, des États-Unis à Taiwan”. Ce qui n’était que le balbutiement de l’IA vocale menace de devenir un assourdissant rugissement qui laissera les artistes du doublage sans voix.

Une vingtaine de syndicats et d’organisations syndicales d’Europe, des États-Unis, d’Amérique latine et d’Asie se sont fédérés au sein de l’United voices artists (UVA). Sous le slogan “Ne volez pas nos voix”, l’UVA milite pour une législation qui garantisse “une utilisation des technologies de l’IA compatibles avec la créativité humaine, respectueuse du règlement général sur la protection des données (RGPD) et des droits des artistes”.

Les artistes pensaient être protégés par le RGPD européen (règlement général sur la protection des données) mais il n’en est rien, souligne encore Laetitia Liénart. Les données sont protégées de leur exploitation dans l’espace public mais les droits des voix peuvent être rétrocédés à un tiers. Et donc être utilisés à des fins d’apprentissage des IA.

Le 25 mai dernier, en marge du Festival de Cannes, et alors que la grève des scénaristes entrait dans sa troisième semaine, à Hollywood, l’UVA a publié un manifeste. L’association appelle “à protéger le travail des acteurs et la créativité humaine dans son ensemble pour éviter la “destruction d’un patrimoine artistique pétri de créativité et d’émotions, qu’aucune machine ne peut produire”.

L’intelligence artificielle “est une menace existentielle” a déclaré Justine Bateman, en marge de la grève des acteurs et des scénaristes à Hollywood. L’ancienne star de la série Family Ties est conseillère de la SAG-AFTRA, le syndicat américain des acteurs, en grève depuis le 14 juillet. “L’IA peut créer une simulation convaincante d’un interprète et elle évolue à une vitesse alarmante.” C’est d’autant plus vrai pour l’usage des seules voix.

guillement Il faut éviter la “destruction d’un patrimoine artistique pétri de créativité et d’émotions, qu’aucune machine ne peut produire.

Deux cents professionnels belges

Les “artistes professionnels de la voix enregistrée” sont nombreux et beaucoup plus familier à nos oreilles qu’on ne le pense : il y a les voix françaises de nos séries étrangères favorites ou des films (pour les spectateurs réfractaires aux versions originales).

Ce sont, aussi, les voix des dessins animés, des publicités, des jeux vidéos, des GPS ou des messageries téléphoniques (oui, celle qui vous demande de patienter quand vous appelez votre banque, une administration ou le service abonnement de votre quotidien préféré…). Toutes ces voix humaines mais préenregistrées pourraient à terme être remplacées par des machines.

Stany Mannaert et Éléonore Meeùs constatent un “ralentissement” de l’activité. ” Les causes sont sans doute multifactoriels” relève la comédienne. “Les plateformes réduisent leur volume de production depuis le début de l’année et il y a sans doute les premiers effets de la grève à Hollywood” – qui a mis un terme aux tournages et amène les plateformes et télévisions à diffuser les nouveaux contenus avec parcimonie.

Vols de voix

Les doubleurs ont vu, sans trop de crainte d’abord, apparaître la concurrence de Text To Speech (TTS). Cette technologie convertit un texte écrit en discours émis par une voix humaine. C’est la méthode employée par les assistants vocaux virtuels Alexa et Siri.

Les logiciels d’IA intègrent désormais l’“apprentissage automatique” qui leur permet de comparer un échantillon de voix à des millions d’autres. Une plateforme comme revoicer.com offre ainsi une gamme de” plus de 80 voix” dans “plus de 40 langues” pour l’expérience de “synthèse vocale la plus réaliste en ligne”. Le tout pour un tarif mensuel à partir de 37 dollars. Imbattable… surtout pour des professionnels humains dont on siphonne la voix.

guillement [L’IA] s’alimente de nos timbres de voix

”[L’IA] s’alimente de nos timbres de voix” précise Laetitia Liénart. Les rumeurs dans le secteur vont bon train, comme celle relayée au printemps par Le Monde, entre autres. Selon celle-ci, divers acteurs et actrices auraient donné suite à une annonce pour un casting vocal. Officiellement, ils étaient candidats pour prêter leur organe à un assistant vocal de type Siri. Mais lorsqu’on leur a demandé encore et encore de répéter des phrases sur des tonalités différentes, certains ont soudain soupçonné qu’ils étaient utilisés à leur insu pour entraîner une intelligence artificielle.

”On ne peut pas tout vérifier” tempère Laetitia Lienart, qui explique n’avoir aucune preuve sur cette rumeur. Par contre, assure-t-elle, les “vols de voix” se généralisent ou, plutôt l’achat “du timbre de voix afin de nourrir les bases de données des intelligences artificielles” précise Laetitia Liénart “pour une rémunération qui n’est pas du tout proportionnelle à l’usage qu’en font les sociétés”.

Toujours selon nos confrères du Monde, l’association française Les Voix, qui regroupe plus de 210 professionnels français, a dénoncé publiquement un tel “vol de voix”. “Nous avons reçu de certains de nos membres des contrats d’enregistrements 'à finalité de recherche'”, confiait au quotidien français Patrick Kuban, comédien interprète et cofondateur des Voix. “Nous avons ensuite découvert qu’ils étaient utilisés pour entraîner l’intelligence artificielle d’une start-up milanaise.”

Certains contrats sont plus transparents, mais n’en posent pas moins question. En septembre 2022, l’entreprise ukrainienne Respeecher a annoncé la signature d’un contrat avec l’acteur américain James Earl Jones, qui prête sa voix à Dark Vador depuis 1977. Le baryton de 91 ans a accordé à la start-up le droit de reproduire sa voix lors de tout prochain Star Wars – y compris après sa mort.

Des interprètes moins célèbres se voient offrir, eux aussi, l’achat de leur voix – avec cession des droits d’utilisation de celle-ci – pour des montants attractifs. “Cela ressemble à la poule aux œufs d’or pour des personnes en situation précaire mais la somme versée est un one shot pour une utilisation illimitée”, relève Éléonore Meeùs.

Questions juridiques et éthiques

Les innovations s’accélèrent. Début 2021, la start-up israélienne DeepDub a entamé la promotion de son logiciel de doublage auprès des studios hollywoodiens. Grâce à son logiciel d’IA, il est possible de doubler un acteur avec son timbre de voix dans une autre langue. “Pour la première fois, il est possible de conserver la performance et la voix de l’acteur original et de les interpréter dans une autre langue et avec ses intonations” a vanté auprès du média Variety Kevin Reilly, ancien cadre de HBO devenu conseiller auprès de DeepDub.

En 2019, David Beckham a participé à la campagne de sensibilisation Zero Malaria. Dans le spot diffusé via les réseaux sociaux, la star du foot anglais alterne neuf langues, dont le kinyarwandais, le yoruba, l’hindi, le mandarin, le tout d’une traite et sans ciller. L’ancien international britannique n’a pas suivi un coaching intensif pour réaliser cette prouesse linguistique : il est doublé grâce à un logiciel d’intelligence artificielle qui ajuste le mouvement de ses lèvres (lipping dans le jargon) à chaque langue.

Début mai, Google a présenté son outil Universal Translator. Il est capable de traduire le discours d’une personne tout en faisant correspondre le mouvement de ses lèvres avec les spécificités de la langue doublée – comme dans le spot avec David Beckham. Fini les problèmes de synchronisation entre la voix française de Brad Pitt (l’acteur français Jean-Pierre Michaël) et le mouvement de ses lèvres. La star pourra s’exprimer dans toutes les langues avec l’apparence du naturel. Exit, dès lors, le recours aux acteurs doubleurs.

Les questions juridiques et éthiques sont vertigineuses et ne concernent pas que les lignes en petits caractères au bas de contrats douteux. On pourrait faire tenir à une personnalité des propos qu’elle n’a jamais tenus, comme dans la série L’Hôtel du Temps (2021) où Thierry Ardisson a interviewé des défunts comme Coluche ou François Mitterrand.

La BelVA et de l’UVA sont réalistes. “Il ne s’agit pas d’arrêter le recours aux IA, on sait qu’on n’y échappera pas”, précise Laetitia Liénart. “Mais d’obtenir une juste rémunération et protection de l’usage qui est fait de nos voix.” Les associations réclament aussi des garanties quant au maintien du recours aux voix humaines. Elles demandent aussi une traçabilité de voix, notamment afin d’empêcher que celles-ci alimentent les bases de données des IA. Enfin, elles souhaitent faire abolir les clauses de rétrocessions des voix à des tiers.