Un étudiant américain a récemment tenté de créer un logiciel capable de détecter les textes écrits par ChatGPT. Malheureusement, comme nous vous l’expliquions dans un précédent article, beaucoup de textes écrits par une IA ont été identifiés comme écrits par des humains. Toutefois, cela ne veut pas dire qu’il n’y a aucun moyen d’avoir la puce à l’oreille. Un professeur d’université a ainsi pu déterminer que la moitié de ses étudiants avaient écrit leurs travaux avec cette intelligence artificielle. Comment ? En se rendant compte que les mêmes idées revenaient, et toujours dans le même ordre.

Pour comprendre comment débusquer les textes écrits par ChatGPT, il faut avant tout comprendre comment il fonctionne. L’intelligence artificielle passe en revue tout le web (jusqu’en 2021) pour répondre à la question posée par l’utilisateur. À la manière d’un étudiant qui se baserait sur plusieurs sources pour écrire un travail, ou à un travailleur qui s’inspirerait de lettres de motivation existantes pour écrire la sienne. À ceci près que ChatGPT ne copie pas les phrases, il les reformule… en semant quelques indices au passage.

Quelques conseils pour détecter les textes écrits par ChatGPT

- Les formules génériques. ChatGPT calcule en effet la suite la plus probable d’un texte. Comme l’explique BFM TV, “sa réponse sera constituée des mots qui ont le plus de chances d’apparaître dans sa base de données. Soit des mots passe-partout.” L’intelligence artificielle peut faire preuve de complexité, la preuve elle a déjà pu réussir le test de médecine que proposent les établissements américains, mais le texte aura tendance à être uniforme, à employer des mots basiques et à peu oser les effets de style.

- Les mêmes structures. Si plusieurs personnes lui posent la même question, il va y répondre selon la même structure en se servant des mêmes arguments. La forme sera différente de l’un à l’autre, mais la structure sera le plus souvent la même.

- Aucune référence au background de la personne qui écrit. Lorsqu’il écrit un texte, un humain met forcément un peu de lui dedans. Il fait appel à ses propres connaissances du monde, son vécu personnel… Une IA ne pourra jamais reproduire cela. De même, l’IA ne peut pas recopier le style d’écriture d’une personne. Les professeurs qui connaissent bien leurs étudiants peuvent donc vite se rendre compte de quelque chose si son style d’écriture change tout à coup.

- La lacune des événements récents. ChatGPT a scanné tout le web jusqu’en 2021 pour établir sa base de données. Il est donc dépassé si on lui parle d’événements récents. Dans les textes écrits avec ChatGPT, il n’y a donc (pour l’instant) pas de référence aux événements de 2022, comme il nous l’explique lui-même.

- Les fautes d’orthographe. Les fautes d’orthographe vont-elles devenir l’apanage de textes écrits par un humain ? Non, bien sûr, mais si quelqu’un qui avait l’habitude de faire beaucoup de fautes n’en fait tout à coup plus une seule, il peut être intéressant de se poser des questions.

L’IA, seul vrai moyen de détecter une autre IA ?

Les conseils cités ci-dessus reposent en grande partie sur le ressenti du lecteur… qui n’est pas infaillible. Mais tout ce qu’une intelligence artificielle crée, elle peut techniquement le détecter. Des groupes d’experts sont donc en train de travailler sur des technologies capables de détecter les textes générés par ordinateur. En 2019, des personnes du MIT-IBM Watson AI Lab et du Harvard Natural Language Processing Group ont développé un algorithme censé détecter si le texte a été écrit par un robot. Celui-ci porte le nom de Giant Language model Test Room (GLTR).

OpenAI, qui a développé ChatGPT, a aussi annoncé être en train de développer un logiciel capable de détecter les textes écrits par son intelligence artificielle. Dans une conférence à l’Université d’Austin, le professeur Scott Aaronson, chercheur chez OpenAI, a révélé que cela prendrait la forme d’un watermark, autrement dit un filigrane qui serait présent sur chaque texte écrit par ChatGPT. On ne sait toutefois pas exactement comment il serait mis en place. “Nous avons toujours appelé à la transparence autour de l’utilisation de texte généré par l’IA”, a toutefois déclaré un porte-parole d’OpenAI. “Nos politiques exigent que les utilisateurs soient francs avec leur public lorsqu’ils utilisent nos outils.” Mais, pour certains experts indépendants, ce filigrane pourrait être facilement détourné et deviendrait donc inutile…

Sans compter que si un humain repasse dans le texte et améliore la base générée par l’IA, cela rendra toute détection impossible… L’arrivée de ce genre d’outil va donc forcément entraîner des changements dans la société. Plutôt que de s’y opposer, les partisans de l’IA conseillent de réfléchir à un moyen d’en tirer tous les avantages possibles.