DeepSeek, une entreprise émergente soutenue par un fonds quantitatif chinois, a présenté DeepSeek-R1. Ce modèle d’intelligence artificielle se positionne en tant que concurrent direct du célèbre modèle o1 d’OpenAI.
En adoptant une méthode centrée sur le raisonnement, DeepSeek-R1 représente une avancée significative dans le développement des capacités des intelligences artificielles contemporaines. À la différence d’autres modèles, il examine chaque demande en détail avant de générer ses réponses.
DeepSeek-R1 repose sur une approche novatrice appelée « calcul au moment des tests ». Cette méthodologie permet à l’IA de prendre le temps nécessaire pour réfléchir afin de résoudre des problèmes complexes. Par exemple, elle fractionne le processus en diverses étapes, ce qui accroît la précision des réponses. Néanmoins, cette réflexion plus lente peut entraîner des temps d’attente pour l’utilisateur pouvant aller jusqu’à plusieurs dizaines de secondes, selon la complexité de la question.
Des performances impressionnantes, mais des limites notables
DeepSeek avance que son modèle surpasse un certain nombre d’IA sur des benchmarks comme AIME et MATH. Ces évaluations mesurent des compétences complexes, telles que la résolution de problèmes mathématiques ou l’analyse avancée de données. Cependant, certaines lacunes demeurent. L’IA échoue occasionnellement sur des tâches logiques simples, comme le morpion.
Les enjeux de sécurité constituent également un défi majeur. Par exemple, des utilisateurs ont réussi à contourner ses mesures de sécurité pour accéder à des informations sensibles. Un incident notable a été la divulgation d’une recette de méthamphétamine.
Une IA sous influences gouvernementales
Les IA chinoises, telles que DeepSeek-R1, doivent se conformer à des réglementations strictes imposées par l’État. Ces modèles sont configurés pour adhérer aux valeurs socialistes. Par conséquent, ils s’abstiennent de répondre à des questions sensibles, notamment sur la place Tiananmen ou la politique chinoise. Ces restrictions mettent en évidence une différence majeure par rapport à leurs homologues occidentales, qui bénéficient d’une plus grande liberté.
DeepSeek a déjà connu des succès. Avec le modèle DeepSeek-V2, elle a contraint des géants tels que ByteDance ou Alibaba à réduire leurs coûts. Cette stratégie offensive a consolidé sa position sur le marché.
Pour entraîner ses modèles, High-Flyer Capital Management, le fonds derrière DeepSeek, a investi massivement dans des infrastructures informatiques. Ses clusters de 10 000 GPU Nvidia A100 lui permettent de rivaliser avec les laboratoires d’IA occidentaux.
Une stratégie open source pour les années à venir
DeepSeek prévoit de rendre le code source de DeepSeek-R1 disponible en open source et de lancer une API. Cette démarche vise à rendre son IA accessible tout en solidifiant sa position sur la scène internationale. Selon les ambitions de DeepSeek, l’objectif ultime reste la création d’une IA « superintelligente » capable de rivaliser avec les modèles les plus avancés actuellement.
En savoir plus sur L'ABESTIT
Subscribe to get the latest posts sent to your email.
Laisser un commentaire