DeepSeek et Xiaomi cassent les prix de l’IA face aux labs US

Date:

Des baisses de prix qui rebattent les cartes

Le marché de l’IA entre dans une phase de forte pression sur les coûts. DeepSeek a rendu permanent son rabais de 75 % sur V4-Pro, tandis que Xiaomi a réduit jusqu’à 99 % le prix de son modèle MiMo-V2.5 pour certains usages. Ces décisions changent immédiatement la donne pour les entreprises qui consomment des modèles via API, car le prix d’un modèle n’est plus seulement un détail technique : il devient un facteur stratégique de rentabilité.

Pourquoi le prix au token compte autant

Quand un utilisateur consulte un chatbot dans un navigateur, il paie souvent un abonnement fixe. En revanche, une entreprise qui intègre un modèle dans une application paie généralement au token, une unité de texte proche d’une fraction de mot. Chaque requête, chaque réponse et chaque document analysé consomment des tokens. À grande échelle, cette mécanique peut faire basculer un produit entre viabilité économique et coût insoutenable.

  • Input tokens : le texte envoyé au modèle.
  • Output tokens : le texte généré par le modèle.
  • Cache hits : les contenus déjà vus, réutilisés à moindre coût.

Xiaomi et DeepSeek misent sur l’efficacité

Le cas de Xiaomi illustre une optimisation très concrète : plus le système réutilise intelligemment les informations déjà traitées, plus la facture baisse. Fuli Luo, responsable de l’équipe MiMo et ancien développeur clé de DeepSeek-V2, explique que l’architecture de stockage réduit fortement les calculs inutiles. Dans ce cadre, le service peut accepter davantage de charge tout en restant proche du point mort financier, ce qui montre que la baisse de prix n’est pas une simple opération marketing.

  • Le système supporte une gestion plus efficace du KV cache.
  • Le stockage interne peut conserver environ cinq fois plus de données.
  • Les coûts de calcul et de stockage peuvent chuter d’environ 80 %.

Des chiffres spectaculaires pour les entreprises

Les nouveaux tarifs sont particulièrement impressionnants pour les usages répétés. DeepSeek V4-Pro est désormais affiché à 0,435 $ par million de tokens en entrée et 0,87 $ en sortie. MiMo-V2.5-Pro adopte un niveau comparable, avec des cache hits à seulement 0,0036 $ par million de tokens. À ce niveau, l’IA devient beaucoup plus accessible pour des produits qui traitent de grands volumes de texte.

  • 82 milliards de tokens peuvent être obtenus avec certains abonnements haut de gamme chez Xiaomi.
  • Ce volume représente plus de 60 milliards de mots.
  • Les usages les plus favorables sont les agents IA, les outils de recherche documentaire et les systèmes à prompts stables.

Les laboratoires américains suivent une trajectoire différente

Alors que les acteurs chinois baissent leurs prix, certains modèles américains avancent dans l’autre direction. GPT-5.5 a doublé le coût de sortie à 30 $ par million de tokens, tandis que Claude Opus 4.7 s’affiche à 5 $ pour l’entrée et 25 $ pour la sortie. Anthropic a certes maintenu sa grille tarifaire, mais son nouveau tokenizer peut produire jusqu’à 35 % de tokens supplémentaires pour le même texte, ce qui peut alourdir la facture réelle.

  • Gemini 2.5 Pro reste plus modéré côté prix, avec 1,25 $ en entrée et 10 $ en sortie.
  • Les écarts de coût entre modèles peuvent atteindre 15 à 30 fois.
  • Pour des tâches répétitives, la différence de prix devient décisive.

Une guerre de performance, de coût et d’adoption

Le point le plus intéressant n’est pas seulement la baisse tarifaire, mais le fait qu’elle s’accompagne d’une performance élevée. DeepSeek V4-Pro, avec ses 1,6 trillion de paramètres, affiche une qualité proche de Claude Opus 4.6 sur des benchmarks de code, tout en restant bien moins cher. De son côté, MiMo-V2.5 s’inscrit dans la même logique : rendre les modèles de pointe exploitables à grande échelle, sans sacrifier la compétitivité technique.

  • Les benchmarks de type SWE-Verified mesurent des tâches proches du monde réel.
  • Les économies les plus fortes concernent les systèmes qui réutilisent beaucoup de contexte.
  • Pour les éditeurs d’applications IA, le coût du token devient un levier d’adoption massive.

En savoir plus sur L'ABESTIT

Subscribe to get the latest posts sent to your email.

Share post:

Popular

More like this
Related

Canicule : 54 départements en vigilance rouge dès mardi midi

Alors que l’épisode caniculaire se poursuit, la vigilance rouge est étendue par Météo-France aux départements du Calvados, de l’Eure, de la Manche, de la Seine-Maritime et de l’Oise, à compter de mardi, à midi....

Guerre au Moyen-Orient : l’Iran veut administrer le détroit d’Ormuz

« Tout le monde doit savoir que l’administration du détroit d’Ormuz ne redeviendra jamais ce qu’elle était avant la guerre », a affirmé Mohammad Bagher Ghalibaf lundi....

Roumanie : Adrian Vestea recalé, l’AUR réclame des élections anticipées

Alors que la crise politique se poursuit, le parti d’extrême droite AUR, qui progresse dans les sondages, plaide pour des élections anticipées....

Double accident sur l’A9 à Fabrègues : sept blessés, trafic coupé

Un double accident sur l'autoroute A9 a perturbé la circulation toute la matinée, ce lundi, sur la commune de Fabrègues, en direction de Béziers. Le bilan total s'élève à sept blessés....