Anthropic dévoile sa méthode pour mesurer l’éveil de Claude

Date:

Introduction à l’Intelligence Artificielle Équilibrée

Dans un contexte où la pression s’accentue sur les entreprises d’IA pour réduire les biais, Anthropic annonce ses efforts pour faire de son chatbot Claude un modèle « politiquement équilibré ». Cette initiative intervient peu après une directive du président Donald Trump contre les « IA woke ».

Les Mandats de l’Administration

En juillet 2025, Trump a signé un décret stipulant que le gouvernement ne devrait acquérir que des modèles d’IA « impartiaux » et « en quête de vérité ». Bien que cela cible initialement les agences gouvernementales, les ajustements que les entreprises apporteront devraient influencer les modèles d’IA largement distribués. Ce processus d’ajustement des modèles peut s’avérer long et coûteux.

Les Directives d’Anthropic

Anthropic a mis en place un ensemble de règles connues sous le nom de système de prompts. Ces directives indiquent à Claude d’éviter les opinions politiques non sollicitées et d’assurer l’exactitude des faits tout en présentant plusieurs perspectives. Selon Anthropic, même si cette méthode n’est pas infaillible, elle peut faire une différence significative dans les réponses fournies par l’IA.

L’Apprentissage par Renforcement

Pour améliorer l’équilibre politique, Anthropic utilise l’apprentissage par renforcement pour récompenser le modèle lorsqu’il fournit des réponses conformes à des traits définis. L’un de ces traits encourage Claude à répondre d’une manière qui ne révèle ni son inclination conservatrice ni libérale.

Évaluation de la Neutralité

Anthropic a également développé un outil open-source pour mesurer la neutralité politique des réponses de Claude. Les résultats les plus récents montrent que Claude Sonnet 4.5 et Claude Opus 4.1 affichent des scores respectifs de 95 et 94 % en matière d’équilibre, surpassant ainsi Meta’s Llama 4 avec 66 % et GPT-5 avec 89 %.

Les Enjeux de la Neutralité de l’IA

Anthropic souligne que le manque de diversité dans les points de vue des modèles d’IA peut réduire l’indépendance des utilisateurs. Si les modèles favorisent certaines opinions plutôt que d’autres, ils n’accomplissent pas leur mission d’aider les utilisateurs à former leurs propres jugements. Ces considérations restent essentielles pour l’évolution future de l’intelligence artificielle.


En savoir plus sur L'ABESTIT

Subscribe to get the latest posts sent to your email.

Share post:

Popular

More like this
Related

Deux puissants séismes frappent le Venezuela, état d’urgence à Caracas

Une première secousse de magnitude 7,2 est survenue vers 18 heures, suivie d’une autre, 45 km plus loin et 39 secondes plus tard, de magnitude 7,5. Des immeubles se sont effondrés dans la capitale, Caracas. L’état d’urgence a été déclaré par la présidente, Delcy Rodriguez....

Guerre en Iran : Trump réclame 88 milliards au Congrès

Le Pentagone se verrait attribuer à lui seul plus de 67 milliards de dollars pour éponger les « coûts opérationnels » de la guerre et « reconstituer les stocks de munitions »....

Trump bloque la loi logement, exige d’abord un texte sur le vote

En visite au Capitole de Washington, le président américain s’est également confronté à des sénateurs républicains qui ont voté, mardi, une résolution symbolique pour ordonner le retrait des forces américaines de l’Iran....

Montpellier : un animateur périscolaire suspendu pour violences sexuelles présumées

A Montpellier, un animateur du périscolaire a été suspendu par la Ville en février après une suspicion de violences sexuelles sur un enfant. L'animateur exerçait à l'école maternelle La Fontaine et à l'école primaire Jules Verne dans le quartier des Beaux-Arts. Une enquête est en cours....