DeepSeek, une entreprise émergente soutenue par un fonds quantitatif chinois, a présenté DeepSeek-R1. Ce modèle d’intelligence artificielle se positionne en tant que concurrent direct du célèbre modèle o1 d’OpenAI.

En adoptant une méthode centrée sur le raisonnement, DeepSeek-R1 représente une avancée significative dans le développement des capacités des intelligences artificielles contemporaines. À la différence d’autres modèles, il examine chaque demande en détail avant de générer ses réponses.

DeepSeek-R1 repose sur une approche novatrice appelée « calcul au moment des tests ». Cette méthodologie permet à l’IA de prendre le temps nécessaire pour réfléchir afin de résoudre des problèmes complexes. Par exemple, elle fractionne le processus en diverses étapes, ce qui accroît la précision des réponses. Néanmoins, cette réflexion plus lente peut entraîner des temps d’attente pour l’utilisateur pouvant aller jusqu’à plusieurs dizaines de secondes, selon la complexité de la question.

Des performances impressionnantes, mais des limites notables

DeepSeek avance que son modèle surpasse un certain nombre d’IA sur des benchmarks comme AIME et MATH. Ces évaluations mesurent des compétences complexes, telles que la résolution de problèmes mathématiques ou l’analyse avancée de données. Cependant, certaines lacunes demeurent. L’IA échoue occasionnellement sur des tâches logiques simples, comme le morpion.

Les enjeux de sécurité constituent également un défi majeur. Par exemple, des utilisateurs ont réussi à contourner ses mesures de sécurité pour accéder à des informations sensibles. Un incident notable a été la divulgation d’une recette de méthamphétamine.

Une IA sous influences gouvernementales

Les IA chinoises, telles que DeepSeek-R1, doivent se conformer à des réglementations strictes imposées par l’État. Ces modèles sont configurés pour adhérer aux valeurs socialistes. Par conséquent, ils s’abstiennent de répondre à des questions sensibles, notamment sur la place Tiananmen ou la politique chinoise. Ces restrictions mettent en évidence une différence majeure par rapport à leurs homologues occidentales, qui bénéficient d’une plus grande liberté.

DeepSeek a déjà connu des succès. Avec le modèle DeepSeek-V2, elle a contraint des géants tels que ByteDance ou Alibaba à réduire leurs coûts. Cette stratégie offensive a consolidé sa position sur le marché.

Pour entraîner ses modèles, High-Flyer Capital Management, le fonds derrière DeepSeek, a investi massivement dans des infrastructures informatiques. Ses clusters de 10 000 GPU Nvidia A100 lui permettent de rivaliser avec les laboratoires d’IA occidentaux.

Une stratégie open source pour les années à venir

DeepSeek prévoit de rendre le code source de DeepSeek-R1 disponible en open source et de lancer une API. Cette démarche vise à rendre son IA accessible tout en solidifiant sa position sur la scène internationale. Selon les ambitions de DeepSeek, l’objectif ultime reste la création d’une IA « superintelligente » capable de rivaliser avec les modèles les plus avancés actuellement.


En savoir plus sur L'ABESTIT

Subscribe to get the latest posts sent to your email.

Share this post

Articles similaires

4 DéCEMBRE 2024

Jensen Huang veut faire de l’IA la nouvelle infrastructure mondiale

Le PDG de Nvidia, Jensen Huang, a un plan pour apporter une infrastructure d'IA aux pays du monde entier, et il le présente en personne....<div class="media_block"><img...

0

3 DéCEMBRE 2024

Les résultats de recherche de ChatGPT pour les nouvelles sont « imprévisibles » et souvent inexactes.

Des recherches menées par le Tow Center for Digital Journalism de Columbia révèlent que l'outil de recherche ChatGPT d'OpenAI éprouve des difficultés à fournir des informations véridiques....

0

3 DéCEMBRE 2024

Amazon construit un superordinateur IA méga avec Anthropic

Lors de sa conférence Re:Invent, Amazon a également annoncé de nouveaux outils pour aider les clients à créer des programmes d'IA générative, y compris un qui vérifie si les réponses d'un...

0

3 DéCEMBRE 2024

Meta dit qu’elle modère par erreur trop de contenu

Meta, selon Nick Clegg, fait face à des taux d'erreur trop élevés dans la modération de contenu sur ses plateformes, entraînant la suppression injustifiée d'un contenu inoffensif. Clegg a admis...

0

2 DéCEMBRE 2024

La société derrière Arc construit un nouveau navigateur web IA appelé Dia

Image : The Broswer CompanyLe PDG de The Browser Company, Josh Miller, a laissé entendre en octobre qu'il lançait un produit plus axé sur l'IA, qu'une nouvelle vidéo révèle être Dia, un...

0

2 DéCEMBRE 2024

Cette site montre combien l’IA de Google peut tirer de vos photos

Une startup de partage de photos fondée par un ancien ingénieur de Google a trouvé un moyen ingénieux de retourner la technologie de Google contre elle-même....<div class="media_block"><img...

0

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

En savoir plus sur L'ABESTIT

Abonnez-vous pour poursuivre la lecture et avoir accès à l’ensemble des archives.

Continuer la lecture