Fala galera, nesse episódio eu explico o paper do DeepSeek R1, o modelo que está dando o que falar pela sua qualidade comparada ao O1 da OpenAI. No episódio eu explico a pipeline de treinamento do DeepSeek R1, DeepSeek R1-Zero e dos modelos destilados.
Link do grupo do wpp:https://chat.whatsapp.com/GNLhf8aCurbHQc9ayX5oCP
Paper DeepSeek R1: https://arxiv.org/pdf/2501.12948
Instagram do podcast: https://www.instagram.com/podcast.lifewithai
Linkedin do podcast: https://www.linkedin.com/company/life-with-ai