Les modèles IA peuvent être vulnérables aux failles avec peu de documents malveillants

notifications

Cet article reflète l'opinion personnelle du journaliste qui l’a rédigé. La note attribuée est subjective et n’engage que son auteur.

Publié par Nassim Belhaj | Publié le 13 octobre 2025

Une étude d’Anthropic révèle que les attaques de « poisoning » sur l’entraînement des modèles d’IA ne croissent pas avec leur taille, montrant que même de grands modèles restent vulnérables à peu de données malveillantes. Cela souligne l’importance d’une sélection rigoureuse des données et de stratégies de défense robustes pour la sécurité des IA.

Une étude récente menée par Anthropic a révélé que les attaques de « poisoning » lors de l’entraînement des modèles d’intelligence artificielle ne s’intensifient pas proportionnellement à la taille du modèle. Cette découverte offre un nouvel éclairage sur la sécurité des modèles d’IA, qui sont de plus en plus utilisés dans des applications critiques.

Le « poisoning » consiste à introduire des données malveillantes dans le jeu de données utilisé pour entraîner un modèle d’IA, dans le but de le manipuler ou de corrompre ses prédictions. Anthropic a étudié la manière dont ces attaques évoluent en fonction de la taille du modèle et a constaté que même les grands modèles demeurent vulnérables à un nombre relativement faible de documents corruptibles.

Les chercheurs ont découvert qu’il ne faut pas une multitude de documents malveillants pour introduire des « portes dérobées » dans ces systèmes sophistiqués. Quelques intrusions bien placées peuvent suffire à influencer le comportement d’un modèle de manière significative. Toutefois, ces portes dérobées nécessitent des connaissances approfondies sur le modèle ciblé pour être réellement efficaces.

Cette information pourrait être cruciale pour les développeurs cherchant à renforcer la sécurité de leurs systèmes d’IA. Elle suggère une nécessaire vigilance accrue dans la sélection et la gestion des données utilisées pour l’entraînement. De plus, elle incite à développer des stratégies de défense qui ne dépendent pas uniquement de la taille ou de la complexité des modèles.

L’étude soulève des questions sur la robustesse des systèmes actuels face à des attaques ciblées et met en lumière la nécessité pour le secteur de l’IA de se concentrer sur la sécurité des données et des modèles, parallèlement à la poursuite de performances accrues. Cette recherche pourrait bien être un catalyseur pour le développement de nouvelles pratiques de sécurité dans l’industrie.

Note de la rédaction

Cette étude d’Anthropic est un rappel frappant que la croissance en taille des modèles d’IA n’est pas une panacée pour la sécurité. Bien que ces modèles deviennent de plus en plus puissants, leur vulnérabilité à des attaques ciblées, même minimes, révèle une face cachée préoccupante. Pour le public et les développeurs, cette recherche souligne l’importance cruciale d’une vigilance constante quant à la qualité des jeux de données utilisés. C’est aussi une invitation à investir dans des stratégies de défense plus robustes et à repenser les approches actuelles, afin de renforcer la sécurité sans compromettre l’innovation technologique.

Nassim Belhaj

Diplômé de l’Université de Montréal, Nassim est un journaliste spécialisé dans les enjeux futurs de l'humanité liés aux nouvelles technologies. Il se penche particulièrement sur les effets des systèmes d'IA sur la vie quotidienne.

Derniers articles

Google attaque un réseau chinois de cybercriminalité utilisant Gemini pour automatiser des arnaques

Google poursuit un réseau de cybercriminels, basé en Chine, utilisant le logiciel Gemini pour tromper des centaines d...

Les joueurs de Pokémon Go influencent sans le savoir la technologie des drones militaires

L'utilisation des données de Pokémon Go pour entraîner des IA inquiète, car ces informations, collectées à l'insu des...

Google DeepMind dévoile DiffusionGemma, un modèle accélérant l’IA locale par quatre fois

L'intelligence artificielle, notamment via le modèle DiffusionGemma de Google, révolutionne la création de contenu en...

Les entreprises britanniques enregistrent le plus haut taux de cyberincidents en Europe selon une enquête

Les entreprises britanniques font face à une vague de cyberattaques, souvent alimentées par l'intelligence artificiel...

Anthropic dévoile les sujets interdits pour son modèle Fable 5 jugés trop sensibles

Anthropic limite les réponses du modèle Fable 5 sur des sujets sensibles comme la cybersécurité, la biologie et la ch...