o1圈新王，DeepSeek R1/R1-Zero开源来袭~

AIBigModel

于 2025-01-21 11:37:11 发布

阅读量2.1k

点赞数 15

文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/AIBigModel/article/details/145280583

版权

距离DeepSeek-V3开源不到一个月，DeepSeek刚刚又开源了全新推理模型DeepSeek R1、DeepSeek R1-Zero，全面提升推理能力，效果媲美o1。

此前，DeepSeek-R1预览在LiveCodeBench上评估的表现接近 o1-Medium，提供 SOTA 推理性能！

从DeepSeek-V3技术报告，V3的推理能力蒸馏自R1系列模型：

引入了一种创新的方法，将长链推理（Chain-of-Thought, CoT）模型（特别是DeepSeek R1系列模型之一）中的推理能力提取出来，并将其注入到标准的大型语言模型（LLMs）中，尤其是DeepSeek-V3。

https://huggingface.co/deepseek-ai/DeepSeek-R1-Zerohttps://huggingface.co/deepseek-ai/DeepSeek-R1

来源 | PaperAgent

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。