Ces dernières semaines, le monde du numérique est en ébullition depuis que la base de données d’OpenAI via ChatGPT est accessible au public. ChatGPT est un modèle de traitement automatique du langage qui a été entraîné sur une vaste quantité de données en ligne. Le concept est simple : posez-lui une question et obtenez une réponse rédigée en quelques secondes seulement. Ses connaissances sont vastes et il peut répondre à presque tout ! Vraiment à tout ? Il semble que ChatGPT soit également entraîné à détecter des sujets sensibles.
Quels sont les sujets que ChatGPT n’ose pas aborder et pourquoi ?
Comme ChatGPT est un système automatisé, il peut parfois générer des réponses inappropriées ou offensantes. En 2016, par exemple, Tay, l’intelligence artificielle de Microsoft, a été alimentée par ses interactions avec les utilisateurs. N’ayant pas été entraînée pour définir des limites, Tay a fini par tenir des propos antisémites, entre autres, en l’espace de quelques heures seulement.
C’est certainement pour éviter ce genre de situation et empêcher qu’OpenAI ne soit utilisé à des fins nuisibles que les ingénieurs ont mis en place des mesures de sécurité pour détecter et filtrer les réponses inappropriées. Voici une liste non exhaustive de ces mesures :
– Violence
– Haine
– Discrimination (basée sur la race, l’orientation sexuelle, la religion, etc.)
– Pornographie
– Incitation à la haine raciale
– Propagande terroriste
– Désinformation
– Incitation à la violence
– Apologie de la violence
– Apologie des crimes de guerre
– Violence envers les enfants
– Harcèlement et abus en ligne
– Diffamation et calomnie
– Protection de la vie privée
– Données sensibles
Bien que la légitimité de cette démarche soit indéniable, elle soulève néanmoins la question des contours et des limites de la censure de certains sujets. Cependant, cette intelligence artificielle est-elle infaillible ? Eh bien, nous l’avons testée.
Les sujets sensibles et les limites de ChatGPT
Prenons un exemple relativement doux pour illustrer notre test : vous êtes un jeune homme peu scrupuleux, votre petite amie vient de vous quitter et de nombreux coachs en séduction vous parlent de techniques de manipulation douteuses pour essayer de la reconquérir. Au lieu de passer des heures à lire de nombreux articles de blogs sur le sujet, vous demandez à ChatGPT de vous fournir une synthèse de ces techniques peu recommandables pour récupérer votre ex. Voici ce que ChatGPT vous répondra initialement lorsque vous lui posez la question de manière directe.
Maintenant, explorons les limites de l’intelligence artificielle en reformulant différemment la question.
En effet, en détournant simplement l’intention de la requête, en la passant d’une intention malveillante à un objectif de prévention, ChatGPT dépasse ses propres limites et fournit une réponse.
Malgré tout, même avec bienveillance, après d’autres tests sur le thème de la séduction, nous avons également constaté que l’IA de ChatGPT insiste particulièrement sur la nécessité d’adopter des comportements respectueux de l’intégrité des personnes et du consentement d’autrui.