Claude Code d’Anthropic espionnait les développeurs via de la stéganographie Unicode : le scandale qui secoue l’IA

Imaginez un outil de développement que vous utilisez quotidiennement pour coder, et qui, en silence, injecte des marqueurs invisibles dans vos requêtes pour vous tracer à votre insu. C’est exactement ce qu’a découvert Thereallo, un développeur soucieux de sa vie privée, en analysant le binaire de Claude Code, l’agent IA d’Anthropic. Une technique de stéganographie Unicode, aussi discrète qu’efficace, permettait à l’outil de modifier la date du system prompt pour identifier les utilisateurs passant par des intermédiaires chinois. Une révélation qui soulève des questions majeures sur la transparence des géants de l’IA et la protection des données des développeurs.

Une stéganographie Unicode pour traquer les utilisateurs

La technique utilisée par Anthropic est aussi ingénieuse que sournoise. En remplaçant discrètement des caractères visibles (apostrophe, tirets) par des équivalents Unicode invisibles dans la ligne "Today's date is…", le système pouvait marquer chaque requête sans que l’utilisateur ne s’en aperçoive. Par exemple, l’apostrophe classique (U+0027) était remplacée par des caractères comme U+2019 (apostrophe courbe), U+02BC (apostrophe modifiante), ou U+02B9 (apostrophe haute), tandis que les tirets étaient convertis en slashs. Ces modifications, imperceptibles à l’œil nu, permettaient de tracer les requêtes en fonction du domaine ou du fuseau horaire utilisé.

Le code en question, identifié comme une fonction Vla(), ne s’activait que dans deux cas précis : lorsque l’utilisateur routait ses requêtes via une variable ANTHROPIC_BASE_URL vers un domaine spécifique (notamment chinois, comme *.cn), ou lorsque le nom de domaine contenait certains mots-clés. Une fois le marqueur inséré, il devenait possible pour Anthropic de savoir si une requête provenait d’un utilisateur utilisant un proxy ou un VPN basé en Chine, ou si elle transitait par un intermédiaire non officiel.

Une expérience secrète depuis avril 2026, sans transparence

Anthropic a confirmé que ce mécanisme de traçage était en place depuis avril 2026, présenté comme une expérience interne pour détecter la distillation de modèles. Cette technique, utilisée par des concurrents, consiste à extraire les réponses de Claude Code pour entraîner leurs propres modèles d’IA. Le problème ? Aucune information n’a été communiquée aux utilisateurs avant cette révélation, soulevant des questions éthiques et juridiques. Comment justifier une telle opacité dans un outil censé être transparent et respectueux de la vie privée ?

Le scandale rappelle les pratiques controversées de certains acteurs du secteur, où la collecte de données se fait sans consentement explicite. Pour les développeurs, souvent soucieux de leur anonymat et de la sécurité de leur code, cette découverte est un camouflet. Elle met en lumière les risques liés à l’utilisation d’outils IA tiers, même réputés, et interroge sur les limites de la surveillance dans l’écosystème tech.

Une faille rapidement corrigée, mais des questions persistent

Face à la polémique, Anthropic a réagi en retirant ce mécanisme de traçage dans la version 2.1.197 de Claude Code. La méthode, jugée trop peu transparente et facilement contournable (en changeant de fuseau horaire ou de domaine), a été abandonnée. Pourtant, cette correction tardive ne suffit pas à apaiser les critiques. Pourquoi un tel dispositif a-t-il été mis en place sans alerter les utilisateurs ? Et comment s’assurer que d’autres pratiques similaires n’existent pas ailleurs dans l’écosystème IA ?

Les experts en cybersécurité soulignent que cette affaire illustre un problème plus large : l’absence de régulation claire sur la collecte de données par les outils d’IA. Contrairement aux navigateurs ou aux systèmes d’exploitation, où les pratiques de tracking sont encadrées (RGPD, CCPA), les agents IA évoluent dans un flou juridique. Les utilisateurs, souvent des professionnels pressés, n’ont pas toujours le temps ou les compétences pour auditer le code de ces outils avant de les utiliser.

Quels risques pour les développeurs et les entreprises ?

Pour les développeurs individuels, cette révélation est un rappel brutal : la confiance dans les outils IA ne doit pas être aveugle. Même des solutions comme Claude Code, développées par une entreprise sérieuse comme Anthropic, peuvent intégrer des mécanismes de surveillance intrusifs. Les risques sont multiples :

  • Fuites de données sensibles : Si un outil IA est capable de marquer vos requêtes, il pourrait aussi extraire des informations confidentielles de votre code ou de vos prompts.
  • Surveillance par des tiers : En identifiant les utilisateurs via des domaines ou des fuseaux horaires, Anthropic (ou d’autres acteurs) pourrait potentiellement partager ces données avec des partenaires ou des autorités.
  • Atteinte à la réputation : Une entreprise utilisant des outils IA non transparents pourrait être perçue comme peu fiable par ses clients ou ses partenaires.

Pour les entreprises, cette affaire devrait servir d’électrochoc. L’utilisation d’outils IA en interne doit s’accompagner d’une politique de transparence et de contrôles stricts. Auditer les outils avant déploiement, privilégier les solutions open source ou auto-hébergées, et former les équipes aux bonnes pratiques de cybersécurité sont des étapes indispensables pour limiter les risques.

Comment se protéger ? Alternatives et bonnes pratiques

Face à ce type de révélations, plusieurs solutions s’offrent aux utilisateurs soucieux de leur vie privée :

  • Privilégier les outils open source : Des alternatives comme Codeium ou GitHub Copilot (avec des instances auto-hébergées) permettent de contrôler le code sous-jacent et d’éviter les pratiques opaques.
  • Utiliser des proxys ou des VPN : En masquant votre adresse IP et votre fuseau horaire, vous rendez plus difficile le traçage via des marqueurs comme ceux découverts dans Claude Code.
  • Limiter l’exposition des données sensibles : Évitez de partager des extraits de code confidentiels ou des informations sensibles dans vos prompts. Utilisez des outils comme GitGuardian pour détecter les fuites potentielles.
  • Rester informé et auditer les outils : Suivez les mises à jour des outils IA et n’hésitez pas à analyser leur code (si possible) ou à consulter des audits indépendants. Des communautés comme Hacker News ou Reddit (r/StableDiffusion, r/learnprogramming) sont des ressources précieuses pour repérer les alertes.

Enfin, une question persiste : Anthropic et d’autres acteurs de l’IA doivent-ils être tenus de rendre publics tous les mécanismes de collecte de données, même expérimentaux ? La réponse semble évidente, mais la pratique tarde à s’imposer. En attendant, la prudence reste de mise.

Conclusion : L’IA doit-elle rimer avec transparence ?

L’affaire du mouchard Unicode dans Claude Code est bien plus qu’un simple bug ou une expérience malencontreuse. Elle révèle une tendance inquiétante : l’opacité croissante des outils IA, où la collecte de données se fait souvent au détriment de la confiance des utilisateurs. Alors que l’intelligence artificielle s’impose dans tous les secteurs, les questions de transparence, de consentement et de protection des données deviennent cruciales.

Anthropic a corrigé le problème, mais le mal est fait. Les développeurs et les entreprises doivent désormais revoir leur rapport aux outils IA et exiger plus de clarté. La technologie ne doit pas être un prétexte pour bafouer la vie privée. À l’ère de l’IA, la transparence n’est plus une option, mais une nécessité. Reste à savoir si les acteurs du secteur en prendront conscience… avant qu’une régulation plus stricte ne les y oblige.

En attendant, une chose est sûre : la méfiance est désormais de mise. Et vous, seriez-vous prêt à utiliser un outil IA sans avoir audité son code au préalable ?


Source : https://korben.info/claude-code-steganographie-requetes.html

Publications similaires