Comment Identifier le Contenu ChatGPT ? (11 Astuces et Outils)

Vous êtes un manager ou un dirigeant d’entreprise et souhaitez repérer le texte créé par ChatGPT ? Vous désirez vérifier un article écrit par un rédacteur indépendant ? Vous êtes un enseignant cherchant à contrôler si les devoirs de vos étudIAnts ont été générés avec ChatGPT ? Vous cherchez un détecteur de texte ChatGPT efficace ? Dans cet article, nous allons vous présenter les meilleurs moyens de repérer l’intelligence artificielle dans les textes, ainsi que quelques conseils pour déterminer par vous-même si un texte a été créé en utilisant ChatGPT.

Les meilleurs outils pour détecter des contenus rédigés par ChatGPT

Winston AI : un logiciel de détection professionnel et efficace que nous avons testé.

Draft&Goal : un outil d’essai français pour l’intelligence artificielle, et gratuit.

Originality.ai : une alternative professionnelle à Winston AI. Détecter ChatGPT : est-ce possible ? Pour être clair dès le départ, repérer du texte généré par GPT-3, GPT-4 ou ChatGPT est un véritable défi. Le détecteur officiel d’OpenAI a été arrêté en raison de ses performances insuffisantes, selon la firme co-fondée par Sam Altman. Voici leur annonce :

À partir du 20 juillet 2023, le classificateur d’IA n’est plus disponible en raison de son faible taux de précision. Nous nous efforçons d’intégrer les commentaires et recherchons actuellement des techniques plus efficaces pour détecter l’origine du texte. Nous nous engageons à développer des moyens permettant aux utilisateurs de déterminer si le contenu audio ou visuel est généré par l’IA. – OpenAI

Repérer si un contenu a été rédigé avec l’aide de ChatGPT est techniquement difficile, que ce soit pour un outil ou pour un être humain. De plus, il est encore plus difficile pour un humain de savoir si un contenu a été initIAlement créé par ChatGPT puis édité et modifié par un humain.

Cependant, de plus en plus de logiciels entrent sur le marché de la détection de texte IA, et l’analyse de certains éléments peut améliorer vos chances de détection (même sans utiliser d’outil payant).

3 logiciels pour détecter efficacement du contenu rédigé par ChatGPT

1- Winston AI

Positionné comme l’un des leaders de la détection de contenu généré par ChatGPT, Winston AI convient particulièrement aux éditeurs de sites web, aux journalistes, aux rédacteurs et au secteur de l’éducation. Cet outil est capable d’identifier efficacement les contenus issus des principaux modèles de langage IA, y compris GPT-4, Bard et ChatGPT. Dans nos tests, Winston AI a parfaitement reconnu un texte généré par GPT4 vIA ChatGPT. Pour ceux qui souhaitent l’essayer, l’entreprise propose un essai gratuit jusqu’à 2000 mots. Cependant, pour une utilisation plus régulière ou intensive, un abonnement est requis, avec des offres à partir de 18 € par mois pour l’analyse de 80 000 mots.

2- Draft&Goal

Ce logiciel français, spécIAlisé dans l’intégration de l’IA en entreprise, a été développé par Vincent Terrasi. Actuellement en phase bêta, Draft&Goal introduit son propre détecteur de textes générés par l’IA. Cette plateforme en ligne est capable d’analyser des textes en français ou en anglais, à condition qu’ils comptent au moins 400 caractères. Son algorithme se base sur plusieurs critères, comme la longueur du texte, la complexité syntaxique et sémantique, ainsi que la variété lexicale pour évaluer la probabilité que le texte provienne du chatbot d’OpenAI. Un score élevé indique une forte probabilité que le contenu soit généré par une IA. Draft&Goal se distingue par sa capacité à détecter des « empreintes digitales » laissées par les IA pour améliorer la précision de sa détection.

3- Originality.AI

Originality.AI est reconnu comme l’un des détecteurs de ChatGPT les plus précis du marché. Ses algorithmes, utilisant des techniques avancées de traitement du langage naturel, sont efficaces contre les textes produits par des modèles de langage populaires comme ChatGPT, GPT-4 et Bard. Contrairement à Winston AI, Originality.AI n’offre pas d’essai gratuit. Néanmoins, les utilisateurs peuvent analyser jusqu’à 300 000 mots pour seulement 30 euros. Des formules d’abonnement sont également disponibles pour les utilisateurs réguliers. Un avantage notable d’Originality.AI est son extension pour le navigateur Chrome, ce qui facilite les vérifications de contenu sur des plateformes en ligne telles que Google Docs.

Comment détecter des contenus rédigés par ChatGPT sans outil ?

11 points à analyser Comme nous l’avons mentionné précédemment, il est difficile pour une personne non initiée de détecter facilement si un texte a été entièrement produit par ChatGPT. Cependant, voici quelques éléments qui peuvent vous aider à repérer les textes les moins retravaillés. Voici une liste non exhaustive de 11 points clés à analyser :

1 .Longueur et répétition : Les textes générés par GPT-3 ou ChatGPT peuvent parfois être plus longs et plus répétitifs que les textes rédigés par un être humain. L’analyse de la longueur des phrases, du nombre de mots et de la répétition des idées peut être un indicateur.

Absence de personnalité ou d’émotion : GPT-3 et ChatGPT n’ont pas de véritable « personnalité » ou d’émotions. Si un texte semble dépourvu d’opinions personnelles ou d’émotion, il pourrait être le résultat d’une IA.
Style d’écriture : Les contenus rédigés par ChatGPT adoptent généralement un style neutre, prudent et formel. Il est rare qu’un tel texte contienne des opinions claires et non nuancées.
Uniformité : Un texte généré par ChatGPT ou une autre IA aura tendance à être plus uniforme en termes de style et de longueur de paragraphes qu’un texte rédigé par un être humain.
Analyse des erreurs spécifiques : Identifier des erreurs qui sont spécifiques à GPT-3 ou ChatGPT, telles que des incohérences factuelles, l’utilisation d’informations obsolètes ou l’inclusion d’idées non directement liées à la question, peut vous donner une indication sur l’origine du contenu.
Réponses vagues ou génériques : Face à des questions ambiguës, le modèle peut donner des réponses vagues ou génériques. 7. Longueur des réponses : Sauf s’il est demandé de fournir une réponse synthétique, il est difficile pour ChatGPT de répondre de manière concise à une question ouverte. Le modèle a tendance à donner des réponses excessivement longues, même lorsque cela n’est pas nécessaire.
Vérification des faits : Vérifiez les déclarations factuelles faites dans le texte. Si elles sont incorrectes ou obsolètes, cela pourrait être un signe qu’elles ont été générées par GPT-3 ou ChatGPT.
Ponctuation à l’anglaise : Bien que ChatGPT puisse rédiger correctement en français du point de vue grammatical, il n’utilise pas toujours correctement la ponctuation, en particulier le signe « : ». En anglais, les deux points ne sont pas suivis d’un espace, contrairement au français. Cette subtilité peut parfois révéler l’origine du texte.
Présence de majuscules dans les titres : En anglais, l’utilisation de majuscules dans les titres et sous-titres est courante. En français, ce n’est pas la norme. Vous pouvez détecter un texte ChatGPT non retouché en examinant rapidement les titres et sous-titres du contenu.
Absence de fautes d’orthographe : Étonnamment, la présence de fautes d’inattention ou d’orthographe est souvent un indicateur que le contenu a été rédigé par un être humain. Les IA, en revanche, ne commettent généralement pas de fautes d’orthographe.

Ces éléments à analyser sont sujets à interprétation, il est donc difficile d’avoir une certitude absolue après l’analyse d’un texte sur son origine. Pour obtenir un taux de détection plus élevé, il est recommandé d’utiliser un outil de détection formé sur de grandes quantités de données (comme Winston AI).

La structure d’un texte généré par ChatGPT dépend en grande partie du prompt ou de la question initIAle de l’utilisateur.

Toutefois, les réponses de ChatGPT suivent souvent une structure qui ressemble à celle d’une réponse informative ou explicative.

Pour repérer ce type de réponse de manière plus efficace, voici quelques caractéristiques à rechercher dans les textes à analyser :

– Introduction ou contextualisation : ChatGPT commence fréquemment par une brève introduction ou contextualisation de la réponse, en particulier lorsque la question nécessite un contexte pour une compréhension adéquate. Il reformule souvent la question dans la première phrase de sa réponse.

– Réponse directe : Si la question est directe et simple, ChatGPT a tendance à fournir une réponse concise au début avant de fournir davantage de détails.

– Développement : Pour les questions nécessitant une explication détaillée, après la réponse directe, ChatGPT peut apporter des informations supplémentaires, des exemples, des comparaisons ou d’autres éléments pertinents pour enrichir la réponse.

– Conclusion ou récapitulatif : Surtout dans le cas de réponses longues, ChatGPT a tendance à conclure en résumant les points clés mentionnés dans sa réponse précédente. Il commence souvent ces phrases par des expressions comme « En conclusion », « En résumé », …

– Structure question-réponse : Lorsque l’utilisateur pose plusieurs questions en une seule sollicitation, ChatGPT essaie généralement de répondre à chaque question l’une après l’autre, en suivant l’ordre dans lequel elles ont été posées.

– Listes ou énumérations : Pour les questions qui nécessitent des étapes, des recommandations ou des options, ChatGPT structure souvent sa réponse sous la forme d’une liste plutôt que de paragraphes avec des sous-titres numérotés. La présence de nombreuses listes à puces peut donc être un indicateur supplémentaire de contenu généré par ChatGPT.

Il est important de noter que ChatGPT ne suit pas une structure rigide pour chaque réponse, mais en raison de sa nature probabiliste, il peut parfois générer des réponses qui suivent ou ressemblent à cette structure typique.

Est-ce que ChatGPT est détectable ?

Oui, ChatGPT est détectable avec un certain taux de réussite en utilisant des outils spécIAlisés comme Winston AI ou Originality.ai. Cependant, plus un contenu généré par ChatGPT est modifié par un être humain, plus il devient difficile à détecter, que ce soit pour un être humain ou les principaux outils disponibles sur le marché.

Est-il possible de détecter le contenu ChatGPT de manière totalement fIAble ?

Non, il n’est actuellement pas possible d’être certain à 100 % qu’un texte a été exclusivement créé avec ChatGPT. Cela est principalement dû au fait qu’il est possible d’entraîner le chatbot à reproduire un style qu’il n’aurait pas utilisé de manière naturelle (en utilisant des prompts spécifiques). Par conséquent, même si les outils de détection peuvent fournir des indications, il est difficile d’obtenir une certitude totale.

Existe-t-il un filigrane ou une empreinte laissée par ChatGPT dans ses textes ?

Selon des rumeurs non confirmées, OpenAI envisagerait d’ajouter un jeton pour identifier les contenus générés par GPT-3, GPT-4 et ChatGPT afin de faciliter leur détection. Ce jeton, similaire à un filigrane numérique pour les images, permettrait d’indiquer si un texte a été produit par ChatGPT. Il prendrait la forme d’un mot, d’un signe de ponctuation ou même d’une fraction de mot inséré discrètement dans le texte généré.

Bien qu’il soit conçu pour se fondre dans le contenu, il servirait de signature distinctive indiquant que le texte provient du modèle GPT-3 ou GPT-4. Cela faciliterait la détection du contenu généré par ChatGPT en analysant la présence de ces jetons spécifiques. Cependant, il reste à déterminer si un tel outil sera mis à la disposition du grand public, car OpenAI n’a encore rien confirmé à ce sujet.

Comment rendre un texte généré par ChatGPT indétectable ?

Si vous avez utilisé ChatGPT pour rédiger tout ou partie d’un texte et que vous souhaitez cacher son origine à un lecteur, voici quelques étapes à suivre. Tout d’abord, retravaillez le texte pour éliminer les éléments évidents trahissant l’utilisation de l’intelligence artificielle, tels que la ponctuation à l’anglaise et les majuscules à l’anglaise. Ensuite, si le texte le permet, ajoutez des analyses personnelles et des opinions pour le rendre plus naturel et briser le style fade et dénué d’émotion de ChatGPT. Enfin, relisez attentivement le texte généré, simplifiez-le, supprimez les éléments répétitifs et cassez les structures de phrases redondantes fréquemment produites par l’utilisation du chatbot OpenAI.

Comment fonctionnent les outils de détection d’IA et de ChatGPT ?

Pour comprendre le fonctionnement de ces outils, il est essentiel de comprendre d’abord comment les modèles de NLP (Traitement Automatique du Langage Naturel) fonctionnent. Ces systèmes d’intelligence artificielle, spécifiquement conçus pour générer du texte, se basent sur des algorithmes pour prédire le mot suivant dans une séquence, en se basant sur les mots précédents. Au cœur de cette mécanique, l’IA analyse des modèles linguistiques existants en utilisant de vastes bases de données pour détecter des tendances dans l’utilisation des mots en différentes situations. Contrairement à ce que l’on pourrait penser, ces outils ne sont pas véritablement intelligents. En réalité, ils reconnaissent et reproduisent des schémas à partir des informations qu’ils ont reçues lors de leur phase d’entraînement. Ils déterminent ensuite la probabilité qu’un mot spécifique apparaisse en se basant sur le contexte fourni par les mots précédents.

Ces systèmes sont souvent moins inventifs et spontanés que les humains en raison de leur nature prédictive. Par conséquent, un texte hautement prévisible est un indicateur que ces outils utilisent pour déterminer qu’il a été plus probablement généré par une machine que par un être humain. Pour améliorer leurs taux de détection et réduire les faux positifs, les outils de détection de texte IA sont entraînés sur de vastes ensembles de données contenant du contenu généré par des IA.

Que signifient les faux positifs lors de la détection de contenu IA ?

Dans ce contexte, un faux positif se produit lorsqu’un système ou une méthode identifie à tort un morceau de texte comme étant généré par ChatGPT alors qu’il ne l’est pas. Par exemple, si un outil spécIAlisé dans la détection de textes produits par ChatGPT examine un article rédigé par un être humain et conclut à tort que l’article a été généré par ChatGPT, alors cet article est un faux positif pour cet outil. La détection des contenus générés par des modèles comme ChatGPT peut être essentielle dans des contextes où l’on souhaite distinguer les contributions humaines des contenus générés par machine, par exemple pour garantir l’authenticité ou la crédibilité d’une source. Dans de tels contextes, les faux positifs peuvent créer de la confusion ou discréditer à tort des contenus réellement humains.

Gptzero est-il un détecteur d’IA fIAble ?

Gptzero est un système de détection créé par Edward TIAn, un étudIAnt de l’université de Princeton spécIAlisé en apprentissage automatique et intelligence artificielle, en janvier 2023. Bien que ce logiciel en ligne puisse sembler prometteur à première vue, nos tests ont montré que Gptzero n’était pas l’outil de détection le plus intéressant et pertinent actuellement disponible sur le marché. Selon nos résultats, l’outil le plus performant était Winston AI, suivi de près par Originality.ai.

Plus d’informations dans cette vidéo :