Si tu utilises Claude Code dans ton terminal pour coder, cet article ne te concerne pas. Tes limites hebdomadaires ne bougent pas. Elles ont même été doublées le 6 mai dernier.
Par contre, si tu fais tourner des agents via le Claude Agent SDK, si tu lances des claude -p en headless, si tu as des GitHub Actions qui appellent Claude, ou si tu passes par des outils comme OpenClaw, Zed ou Hermes… le calcul économique change le 15 juin. Et pas qu’un peu.
Es-tu concerné ?
Anthropic a annoncé le 14 mai la séparation du billing en deux pools distincts. Voici comment savoir si ça te touche.
Rien ne change si tu utilises :
- Claude Code en mode interactif (tu tapes, Claude répond)
- Claude.ai sur le web, desktop ou mobile
- Claude Cowork
Tu es concerné si tu utilises :
- Le Claude Agent SDK
claude -p(mode headless, non-interactif)- Claude Code via GitHub Actions
- Des apps tierces branchées sur l’Agent SDK
Tout ce deuxième groupe sort du forfait flat le 15 juin et passe sur un crédit mensuel dédié, facturé au tarif API standard d’Anthropic.
Les crédits, plan par plan
| Plan | Crédit Agent SDK / mois |
|---|---|
| Pro (20 $/mois) | 20 $ |
| Max 5x (100 $/mois) | 100 $ |
| Max 20x (200 $/mois) | 200 $ |
| Team Standard | 20 $ / place |
| Team Premium | 100 $ / place |
Trois points essentiels. Les crédits ne se cumulent pas d’un mois sur l’autre. Tu dois réclamer ton crédit via un email qu’Anthropic enverra avant le 15 juin. Et une fois le crédit épuisé, tu peux activer les “Usage Credits” pour continuer à être facturé au tarif API, ou les désactiver pour bloquer les requêtes et éviter les mauvaises surprises.
Combien ça coûte concrètement
Les tarifs API en vigueur :
| Modèle | Input | Output | Cache hit (input) |
|---|---|---|---|
| Opus 4.7 | 5 $/MTok | 25 $/MTok | 0,50 $/MTok |
| Sonnet 4.6 | 3 $/MTok | 15 $/MTok | 0,30 $/MTok |
| Haiku 4.5 | 1 $/MTok | 5 $/MTok | 0,10 $/MTok |
MTok = million de tokens. Un token ≈ 4 caractères en anglais.
Prenons un scénario courant : un agent qui fait du code review sur un repo de quelques milliers de lignes, ou qui génère des tests pour un module. Ce type de session consomme entre 500K et 1M de tokens. Comptons 1M de tokens, répartis 60 % input (le contexte du code) et 40 % output (les suggestions, le code généré).
Sonnet 4.6, sans cache
~7,80 $
par session
~12 sessions/mois avec 100 $
Sonnet 4.6, cache 80 %
~6,50 $
par session
~15 sessions/mois avec 100 $
Haiku 4.5, CI léger
~0,52 $
par run
~190 runs/mois, ~9/jour ouvré
Pour des sessions lourdes sur Opus ou Sonnet, un crédit de 100 $ tient deux à trois semaines si tu es discipliné. Si tu lances des agents en boucle sans surveillance, il fond en quelques jours.
Le delta en une image
Un utilisateur Max 5x qui lance 30 sessions agent Sonnet par mois. Avant le 15 juin, c’est couvert par le forfait flat à 100 $. Après, ces mêmes 30 sessions coûtent 234 $ au tarif API sans cache.
Delta : +134 $ (+134 %)
Avec un bon cache (80 % de hit), ça descend à 195 $. Mieux, mais toujours au-dessus du crédit inclus. Le message est clair : l’optimisation n’est plus optionnelle.
Comment faire durer ton crédit
Le cache, c’est ton levier principal. Les tokens en cache coûtent 10 % du prix input standard. Sur l’API, tu as deux options : un cache 5 minutes (écriture à 1,25x le prix input) ou un cache 1 heure (écriture à 2x). Le cache 5 minutes est le défaut et le plus rentable si tu enchaînes les runs : chaque lecture relance le compteur de 5 minutes, donc tant que tes requêtes se suivent à moins de 5 minutes d’intervalle, le cache reste vivant et tu paies 0,30 $ au lieu de 3 $ par million de tokens sur Sonnet. Si tu as des runs plus espacés, le cache 1 heure coûte plus cher à l’écriture mais s’amortit vite sur des sessions longues.
Choisis le bon modèle par tâche. Haiku 4.5 à 1 $/MTok en input coûte 5 fois moins que Opus 4.7. Pour du linting, des tests unitaires, ou du code review simple, Haiku suffit largement. Réserve Opus aux tâches qui exigent du raisonnement complexe sur de gros fichiers.
Évite les sessions marathon. Un agent qui tourne 3 heures accumule un contexte de conversation qui grossit à chaque échange. À chaque tour, tout l’historique est reprocessé en tokens. Découper en tâches de 10 à 15 minutes avec un objectif clair coûte moins cher qu’une session tentaculaire de 2 heures.
Surveille le toggle “Usage Credits”. Si tu le laisses activé, les requêtes continuent après épuisement du crédit et tu paies au réel sans plafond. Si tu veux garder le contrôle, désactive-le.
Pourquoi Anthropic fait ça
Le modèle “forfait flat pour tout” n’était pas soutenable. Quelqu’un qui utilise Claude en chat interactif et quelqu’un qui lance 50 agents autonomes en parallèle via le SDK, ce n’est pas le même coût serveur. Anthropic facturait les deux au même prix.
Côté communauté, le sentiment dominant c’est “c’est un nerf déguisé en feature.” Et pour les power users du SDK, c’est vrai : 100 $ en tarif API ne va pas aussi loin que l’ancien forfait quasi illimité.
Mais côté business, la logique est lisible. Sur la base clients RAMP, les dépenses corporate pour Anthropic ont dépassé celles d’OpenAI en avril (34,4 % contre 32,3 %). Ce n’est pas une mesure d’adoption globale, c’est un indicateur de dépenses sur un panel d’entreprises, mais la tendance est nette. Ils ont aussi lancé une joint-venture services enterprise avec Blackstone et Goldman Sachs. Tout pointe vers la même direction : scaler l’écosystème Agent SDK, pas subventionner les power users à perte.
Séparer le billing, c’est rendre chaque pool prévisible. Pour les entreprises, c’est un argument de vente. Pour les indépendants, c’est une contrainte en plus.
Ce qu’il faut faire avant le 15 juin
- Réclame ton crédit dès réception de l’email d’Anthropic. Pas de claim, pas de crédit.
- Audite ton usage réel. Combien de runs
claude -pou d’appels SDK par semaine ? Convertis ça en coût API avec les tarifs ci-dessus. - Configure le toggle “Usage Credits” selon ta tolérance au risque.
- Préviens ton équipe. Si des pipelines CI appellent Claude, le propriétaire du pipeline doit savoir.
- Teste Haiku 4.5 sur tes tâches automatisées. 5 fois moins cher qu’Opus, souvent suffisant.
Tarifs vérifiés le 23 mai 2026 sur la page pricing officielle d’Anthropic. L’annonce du split billing a été publiée le 14 mai 2026. Le doublement des limites interactives a été annoncé sur le blog Anthropic le 6 mai.