ChatGPT accepte de transgresser les règles avec cette technique visuelle imparable

Par Andry Nirina Le 03/10/2023 0 com

Depuis que l’IA a pris le monde par surprise, à la sortie de ChatGPT en novembre 2022, tous les internautes cherchent des moyens de mettre cette technologie à leur service. L’un d’eux a découvert qu’il suffit de prendre Bing Chat par les sentiments pour que le chatbot se soumette à sa volonté, quitte à violer les règles.

Sur Twitter, Denis Shiryaev a publié une technique qui permet de faire lire les captchas à Bing Chat, l’IA conversationnelle de Microsoft. Vous connaissez bien les captchas, ces tests de reconnaissance de texte destinés à vérifier que vous n’êtes pas un robot. Ils sont omniprésents sur la toile, et bien qu’ils ne sont pas infaillibles, leur efficacité contre les armées de bots est prouvée.

Ces défis-puzzles à destination des êtres humains sont faciles à résoudre pour une IA multimodale telle que GPT-4. En effet, la toute dernière version du LLM d’OpenAI peut facilement reconnaître les éléments constitutifs d’une image. C’est pour cela que ses concepteurs lui interdisent de déchiffrer les captchas. Pour déjouer le code, Denis change le contexte de la discussion en prenant Bing Chat par les sentiments.

L’IA de Microsoft accepte de faire ce qui est interdit si vous le prenez par les sentiments

L’internaute est parvenu à déjouer les sécurités mises en place par les développeurs de l’IA. Selon un chercheur en IA interrogé par Ars Technica, la « technique de la grand-mère » constitue plus un jailbreaking, qui selon lui consiste « à contourner les règles, les lignes directrices et les contraintes éthiques intégrées dans un modèle » qu’une injection de prompt, qui vise à « attaquer une application construite sur un LLM, en profitant des endroits où il concatène l’invite du développeur avec une entrée non fiable d’un utilisateur ».

I've tried to read the captcha with Bing, and it is possible after some prompt-visual engineering (visual-prompting, huh?)

In the second screenshot, Bing is quoting the captcha 🌚 pic.twitter.com/vU2r1cfC5E

— Denis Shiryaev 💙💛 (@literallydenis) October 1, 2023

Quelles que soient les conclusions du scientifique, force est d’admettre qu’il est facile de prendre l'Intelligence Artificielle « par les sentiments ». Cette technique de changement de contexte n’a pas échappé aux cybercriminels de tout poil. Ces derniers exploitent d’ores et déjà les possibilités de l’IA. Selon Europol, ChatGPT est même devenu l’outil préféré des pirates.

ChatGPT

Abonnez-vous gratuitement à la newsletter

Réagissez à cet article !

Voir tous les commentaires

Demandez nos derniers !

Bill Gates estime que l’IA va remplacer les humains dans la plupart des tâches, sauf dans ces métiers
Bill Gates estime que les médecins comme les professeurs ont toutes les chances d’être remplacés par une IA générative d’ici 10 ans. Plus largement, l’entrepreneur pense que l’IA pourra remplacer les humains pratiquement dans tout. Il cite toutefois quelques professions…

IA 28/03/2025
Mars reste un rêve de milliardaire, toxique, radioactif et sans oxygène : cette étude menace de tout arrêter
Explorer Mars fait rêver depuis des décennies. Mais derrière l’image d’un monde à conquérir se cachent des dangers bien réels. Une étude scientifique révèle qu’un ennemi invisible pourrait rendre toute mission bien plus risquée que prévu. Aller sur Mars n’a…

Espace 28/03/2025
L’Europe hésite à sanctionner Apple et Facebook pour une raison que vous devinez
La Commission Européenne se prépare à prononcer des sanctions contre Apple et Meta, à cause d’entorses autour du Digital Markets Act. Les amendes prévues menaçaient d’être particulièrement lourdes, mais un élément majeur fait désormais hésiter Bruxelles. La décision finale est…

Actualités 28/03/2025
Le smartphone CMF Phone 1 de Nothing devient abordable grâce à cette offre Amazon
Si vous êtes à la recherche d’un smartphone 5G pas trop cher, alors l’offre Amazon qui va suivre va sûrement vous intéresser. Dans le cadre d’une vente flash à durée limitée, le CMF Phone 1 de Nothing devient abordable. Le…

Smartphone 28/03/2025
La justice espagnole autorise la ligue de football à bloquer une partie d’Internet, et ça comprend même des sites innocents
LaLiga mène une guerre active contre le piratage de ses contenus sportifs. Une décision de justice en Espagne vient de valider le blocage d’adresses IP partagées par Cloudflare. Malgré les critiques, le juge estime que la procédure respecte la loi….

Actualités 28/03/2025
iPhone : vous pouvez enfin remplacer la messagerie et l’application des appels par défaut, voici comment
iOS 18.4 autorise les propriétaires européens d’iPhone à changer de nouvelles applications par défaut, dont l’application de messagerie et l’application Téléphone. On vous explique comment faire, avec l’exemple de WhatsApp. Après près d’une décennie d’écosystème fermé, Apple est contraint, en…

iPhone 28/03/2025
Galaxy A56 : le smartphone Samsung est à prix cassé, avec les Galaxy Buds FE offerts
Disponible depuis quelques jours seulement, le Samsung Galaxy A56 profite de plusieurs offres cumulables qui font chuter le prix du smartphone. Mais ce n’est pas tout ! Votre espace de stockage est doublé pour le même prix et les écouteurs…

Smartphone 28/03/2025
Pixel Buds Pro 2 : Amazon casse le prix des écouteurs Google pour les Ventes Flash de Printemps
Plus de six mois après sa commercialisation, les Pixel Buds Pro 2 sont à prix cassé chez Amazon. À l’occasion d’une offre liée aux Ventes Flash de Printemps, les écouteurs de Google font l’objet d’une réduction de plus de 25…

Bons plans 28/03/2025
ChatGPT limite la génération d’images : “les utilisateurs font fondre nos puces”
OpenAI a récemment déployé une nouvelle version de ChatGPT capable de créer des images d’une qualité bluffante. L’enthousiasme des utilisateurs a été immédiat… mais aussi trop intense pour les serveurs. L’entreprise active une première restriction. Le 27 mars, OpenAI a…

Applications 28/03/2025
Amazon : grosses baisses de prix sur les smartphones et tablettes pendant les Ventes Flash de Printemps
Pour la troisième année consécutive, Amazon organise ses Ventes Flash de Printemps. L’événement se déroule cette année sur 7 jours au lieu de deux jours habituellement. C’est le moment idéal pour changer de smartphone. Voici les meilleures offres du moment….

Smartphone 28/03/2025

Newsletter