Nvidia lance une plateforme révolutionnaire pour l’entraînement IA massif

Date:

Introduction à Dynamo 1.0

Nvidia Corp. a récemment suscité un vif intérêt dans le domaine de l’intelligence artificielle avec le lancement de Dynamo 1.0, une plateforme open-source conçue comme une couche logicielle essentielle pour les déploiements AI à grande échelle. Cette annonce, faite lors de la GPU Technology Conference à San Jose, répond à l’un des défis majeurs de l’IA en entreprise : comment gérer des charges de travail génératives et agentiques de plus en plus complexes de manière efficace.

Une Révolution dans l’Inference

Nvidia met en avant l’importance croissante de l’économie de l’inférence, la rendant aussi cruciale que la performance brute des modèles. Ian Buck, vice-président de l’informatique hyperscale et haute performance, a souligné que « lorsque nous augmentons la complexité, la valeur et la capacité de l’IA suivent également. » Dynamo est conçu pour offrir des performances optimisées sur la plateforme AI superordinateur Vera Rubin NVL72, promise d’atteindre jusqu’à dix fois le débit par watt.

Une Stratégie au-delà du Matériel

Avec le développement de Dynamo, Nvidia vise à transcender son rôle traditionnel de fournisseur de puces et de serveurs pour devenir un acteur majeur dans le domaine des logiciels d’orchestration d’infrastructure AI. Dynamo facilitera les tâches d’inférence générative et agentique tout en intégrant une multitude de frameworks d’inférence et d’orchestration populaires, reflétant une stratégie ambitieuse d’extension de portée.

Une Réponse à la Complexité des IA Agentiques

La montée de l’IA agentique engendre des exigences nouvelles en termes d’infrastructure. Nvidia définit ces exigences comme la « quatrième loi de mise à l’échelle », dépassant les trois premières liées à la préformation et aux phases de test. Ces modèles devront interagir non seulement avec les humains, mais aussi entre eux, exigeant des performances d’inférence à faible latence et avec un contexte large.

Optimisation des Ressources GPU avec Dynamo

  • Maximisation de l’Utilisation des Flottes GPU : Dynamo optimise l’allocation des ressources GPU pour améliorer l’efficacité.
  • Planification Intelligent : Le planificateur de Dynamo surveille l’activité pour réallouer les ressources de manière appropriée.
  • Router Avancé : Le routeur intelligent de Dynamo minimise le recalcul grâce à une prise en charge du KV-cache.

Les modèles agentiques nécessitent une rapidité d’exécution, nécessitant de traiter 1 500 tokens par seconde avec des systèmes pouvant atteindre jusqu’à 10 trillions de paramètres.

Un Écosystème d’Agents Autonomes

Dynamo s’intègre dans un ensemble plus vaste d’outils logiciels pour les agents AI, comprenant le Agent Toolkit, qui facilite la création et l’optimisation d’agents autonomes. Ce package offre des modèles open-source, des environnements d’exécution et des plans pour concevoir des agents plus sûrs et plus efficaces. Cette approche positionne Nvidia en leader sur le marché des logiciels d’IA, attirant des partenaires dans un écosystème dynamique.

Pour découvrir plus sur ce sujet, consultez cette vidéo YouTube :

Dynamo 1.0 Release Announcement


En savoir plus sur L'ABESTIT

Subscribe to get the latest posts sent to your email.

Share post:

Popular

More like this
Related

Canicule : 54 départements en vigilance rouge dès mardi midi

Alors que l’épisode caniculaire se poursuit, la vigilance rouge est étendue par Météo-France aux départements du Calvados, de l’Eure, de la Manche, de la Seine-Maritime et de l’Oise, à compter de mardi, à midi....

Guerre au Moyen-Orient : l’Iran veut administrer le détroit d’Ormuz

« Tout le monde doit savoir que l’administration du détroit d’Ormuz ne redeviendra jamais ce qu’elle était avant la guerre », a affirmé Mohammad Bagher Ghalibaf lundi....

Roumanie : Adrian Vestea recalé, l’AUR réclame des élections anticipées

Alors que la crise politique se poursuit, le parti d’extrême droite AUR, qui progresse dans les sondages, plaide pour des élections anticipées....

Double accident sur l’A9 à Fabrègues : sept blessés, trafic coupé

Un double accident sur l'autoroute A9 a perturbé la circulation toute la matinée, ce lundi, sur la commune de Fabrègues, en direction de Béziers. Le bilan total s'élève à sept blessés....