Risque financier et nécessité d’engagements écrits
Avec des taux de défaut des entreprises privées atteignant 9,2 %, les acteurs du capital-risque recommandent désormais de sécuriser par écrit les engagements de capacité de calcul pour les projets d’IA. Exemple : une startup de vision industrielle qui dépend d’une ferme GPU en colocation peut se retrouver bloquée si le fournisseur réduit ses ressources ; un simple accord verbal ne protège pas contre ce risque. Points clés :
- Risque de contrepartie élevé en cas d’instabilité financière des fournisseurs.
- Importance contractuelle : SLA et clauses de continuité opérationnelle.
- Scénarios concrets : perte d’accès GPU, augmentation imprévue des coûts, interruption de service.
Modèles locaux : la réponse de Multiverse à la dépendance cloud
Une alternative consiste à exécuter des modèles d’IA directement sur l’appareil de l’utilisateur pour éliminer la dépendance au cloud. La startup espagnole Multiverse propose cette voie avec sa technologie CompactifAI et le modèle Gilda, suffisamment compressé pour tourner hors ligne. Exemple : un agent conversationnel embarqué sur tablette terrain qui répond sans connexion. Avantages notables :
- Confidentialité renforcée : les données restent sur le terminal.
- Résilience : fonctionnement en zones déconnectées (drones, sites isolés).
- Réduction des coûts de calcul pour l’entreprise.
Fonctionnement technique et limites pratiques
Faire tenir un modèle utile sur un smartphone implique des compromis : mémoire, stockage et latence. Multiverse bascule automatiquement vers le cloud lorsque l’appareil manque de RAM ou d’espace via un système de routage appelé Ash Nazg, perdant alors l’avantage principal de confidentialité. Exemples de limitations :
- Appareils anciens (ex. certains iPhone) manquent de RAM pour exécuter Gilda.
- Le passage au cloud peut être déclenché par une requête lourde ou des données d’entrée importantes.
API self-serve et cas d’usage en entreprise
Plutôt que de viser massivement le grand public, Multiverse cible les entreprises avec un portail API qui donne un accès direct aux modèles compressés et un suivi d’usage en temps réel. Exemple : une banque qui intègre un petit modèle local pour pré-analyser des formulaires avant envoi au backend cloud. Bénéfices pour les entreprises :
- Surveillance en temps réel de la consommation et des coûts.
- Contrôle sur le déploiement et la transparence de performance.
- Cas concrets : automatisation embarquée, analyse à la périphérie, aide au diagnostic en milieu industriel.
Comparaisons avec l’écosystème IA : Mistral, OpenAI, Apple
Le marché des petits modèles progresse : Mistral a optimisé sa famille de petits modèles (ex. Mistral Small 4) tandis que d’autres acteurs combinent modèle local et cloud (ex. Apple Intelligence). Multiverse affirme que son modèle compressé HyperNova 60B 2602 (basé sur gpt-oss-120b) offre des réponses plus rapides et moins coûteuses que la version d’origine, utile notamment pour des workflows d’agentic coding. Points de comparaison :
- Performance vs taille : choix d’optimisation selon l’usage (chat, code, raisonnement).
- Approche hybride (local+cloud) vs exclusif local.
- Flexibilité : Forge de Mistral pour construire des modèles sur mesure.
Adoption, clients et perspectives financières
CompactifAI reste modeste en téléchargements (<5 000 sur le dernier mois) mais vise les entreprises : Multiverse sert déjà plus de 100 clients mondiaux (ex. Bank of Canada, Bosch, Iberdrola). Après un Series B de 215 M$, la société serait en discussions pour une levée supplémentaire d’environ €500 M à une valorisation supérieure à €1,5 Md. Implications et étapes stratégiques :
- Renforcer l’adoption en entreprise via preuves de concept et intégrations sectorielles.
- Optimiser la compatibilité matérielle pour élargir la base d’appareils supportés.
- Monétisation : modèles API, contrats d’abonnement et services d’intégration.
En savoir plus sur L'ABESTIT
Subscribe to get the latest posts sent to your email.



