Quand l’ASCII art montre les limites des sécurités des IA génératives

**** * **** * * **** * **** * ******

Image may be NSFW.
Clik here to view. Hacking IA en ASCII

Des chercheurs ont montré que les systèmes de sécurité de cinq IA génératives majeures pouvaient être facilement contournés en remplaçant les mots censurés par des mots écrits en ASCII art puis retranscrits par la machine.

GPT-3.5, GPT-4, Gemini, Claude, et Llama2 sont cinq grands modèles de langage capables de reconnaître des mots dans les ASCII arts. Mais des chercheurs se sont emparé de cette capacité pour éviter le contrôle des systèmes de sécurité mis en place par OpenAI, Google, Anthropic et Meta.

Dans un article mis en ligne sur la plateforme de preprints arXiv, Fengqing Jiang et ses collègues montrent qu’il est possible de contourner les systèmes de sécurité de ces modèles de langage en écrivant le mot bloqué en ASCII art.

Cette forme d’art numérique, qui consiste à réaliser des images en utilisant des caractères ASCII en vogue déjà dans les années 60, pourrait être un des talons d’Achille des grands modèles de langage.

Quand l’ASCII art montre les limites des sécurités des IA génératives

**** * **** * * **** * **** * ******

Une sécurité au niveau sémantique peu élevé

Vous devez être abonné•e pour lire la suite de cet article.
Déjà abonné•e ? Générez une clé RSS dans votre profil.

Trending Articles

Colorier de manière structurée MS

Libreville : Studio meublé à louer Libreville (Libreville) 30 000 FCFA

bruit sur l'hydraulique tracteur john deere 2020

PAIRE ENCEINTES SHARP CP8800 200 watts - 100 €

Trois Salazes: Chute mortelle ce matin

[Tuto]Comment Installer FreeShop sur 3DS 2DS ou New3DS New2DS 11.6 ?

Hellas Dinghy - 15.000 EUR

Sauvetage - Rossi-Rescue : Une première en Polynésie

Biens de leur défunt époux : L'ancien ministre Mata Sy Diallo accusée par sa...

Arrêté n° 2018-450/PN du 10 août 2018 autorisant l’exploitation d’une...

RCF TT08A II 1000w RMS pour 11 kgs - 2 700 €

hiCOLLECTION OUTIL ANCIEN CANTONNIER FER DE COUPE SAIGNEE

J'ai une erreur quand j'essaye de souscrire au forfait B&you à 4€99

Jensen Jan Krogh

Dysgraphie : évaluation avec l'échelle BHK

Forum Economique: Portrait de David Chungue, gérant d'ISI.pf

Celleneuve - Isis Hammam

Re : Panne chaudière chaffoteaux

yamaha clavinova CVP-5 - 500 €

Georges Bizet, juif comme l’Arlésienne

******** ******* ** ** ******** ** ** ** ** *** *** ** ** ** ** ** ** **** **** ** ** ******** ** ** ** *** ** ******** ** ** ** ** ** ** ** ** ** ** ** ** ** ** ** ** ******** ******* ** ** ********

Une sécurité au niveau sémantique peu élevé

Vous devez être abonné•e pour lire la suite de cet article.Déjà abonné•e ? Générez une clé RSS dans votre profil.

Trending Articles

**** * **** * * **** * **** * ******

Vous devez être abonné•e pour lire la suite de cet article.
Déjà abonné•e ? Générez une clé RSS dans votre profil.