Análisis técnico de Deepseek R1, ¿qué hace distinto y cómo?
28 January 2025

Análisis técnico de Deepseek R1, ¿qué hace distinto y cómo?

Apple Coding Daily

About

Deepseek v3 y su modelo de razonamiento R1, han revolucionado el mundo de la IA como hacía mucho que no se sucedía. Incluso afectando al índice bursátil tecnológico (el NASDAQ) y provocando la mayor caída en valor de la historia de la humanidad en un solo en NVIDIA.



Pero, ¿por qué todo este revuelo? ¿Qué hace distinto Deepseek o qué aporta al mercado de la IA para que lleguemos a esa situación?



En este programa, analizamos qué es Deepseek de forma técnica: qué innovaciones ha aportado en su entrenamiento o cómo se ejecuta para ahorrar una considerable cantidad de recursos.



Te explicamos los pilares fundamentales, como la arquitectura MLA de atención latente múltiple, la arquitectura mejorada de sistemas expertos o la predicción multi-token que se usado en su entrenamiento así como las distintas capas de mejora en dicho proceso que ha permitido un modelo más eficiente, con menos necesidad de recursos y menor coste.



Una lección magistral de cómo se entrena y ejecuta la IA analizando el modelo más moderno y eficaz de la actualidad.




Iníciate en el mundo del Desarrollo iOS con el Swift Developer Program 2025. Encuentra toda la información pulsando aquí.



Suscríbete a nuestro canal de Youtube: Apple Coding en YouTube



Descubre nuestro canal de Twitch: Apple Coding en Twitch.



Descubre nuestras ofertas para oyentes:




- Cursos en Udemy (con código de oferta)



- Apple Coding Academy



- Suscríbete a Apple Coding en nuestro Patreon.



- Canal de Telegram de Swift. Acceso al canal.




---------------



Consigue las camisetas oficiales de Apple Coding con los logos de Swift y Apple Coding así como todo tipo de merchadising como tazas o fundas.




- Tienda de merchandising de Apple Coding.