01 June 2025

Deepseek R1, meilleure IA du marché ?

Choses à Savoir TECH

About

Dans le grand bal mondial de l’intelligence artificielle, la Chine avance à pas mesurés, mais assurés. Et l’un de ses fers de lance, DeepSeek, vient de marquer un nouveau point. La start-up, déjà repérée pour ses choix techniques efficaces et peu coûteux, vient de publier une mise à jour de son modèle de raisonnement sur la plateforme Hugging Face, haut lieu du partage de modèles IA. Nom de code : R1-0528.

Une mise à jour qualifiée de « mineure » par ses créateurs. Mais dans les faits, les testeurs parlent de progrès sensibles, notamment sur la logique complexe et la génération de code. Sur des bancs d’essai comme LiveCodeBench, le modèle DeepSeek se hisse désormais juste derrière les modèles o4-mini et o3 d’OpenAI. Un résultat plus qu’honorable. Là où R1-0528 brille, c’est dans son raisonnement structuré. Il applique désormais la méthode dite de la "chaîne de pensée" : une démarche plus rigoureuse, où chaque étape de réflexion est explicitée avant de parvenir à une conclusion. Cette capacité à détailler son raisonnement améliore nettement la qualité des réponses, tout comme la cohérence des textes générés, débarrassés des bizarreries que l’on retrouvait parfois dans les versions précédentes.

Autre évolution remarquée : la gestion des contextes longs. Avec une capacité d’attention jusqu’à 128 000 tokens, R1-0528 peut suivre un fil complexe pendant plus de 30 minutes. C’est une avancée cruciale pour les tâches qui demandent de la concentration sur la durée. Le revers de la médaille ? Un temps de réponse un peu plus long, mais jugé acceptable compte tenu des gains en précision. Côté architecture, DeepSeek reste fidèle à son modèle Mixture-of-Experts : 685 milliards de paramètres, dont seulement 37 milliards activés en simultané. Résultat : un modèle colossal, mais économe en ressources. Le coût d'entraînement du modèle R1 originel ? Moins de 6 millions de dollars. Une prouesse quand on sait que d'autres modèles similaires dépassent allègrement les centaines de millions. Enfin, DeepSeek reste fidèle à sa politique d’ouverture : le modèle est publié sous licence MIT, libre d’usage, même commercial. De quoi séduire développeurs indépendants et start-up, avec un accès simplifié via Hugging Face. Discrète mais redoutablement efficace, la Chine confirme qu’elle ne compte pas rester spectatrice de la révolution IA.

Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.