DeepSeek R1迎来小更新大升级，性能直逼OpenAI o3！

最新推荐文章于 2025-05-29 14:43:39 发布

CSDN资讯

最新推荐文章于 2025-05-29 14:43:39 发布

阅读量5.8k

点赞数 10

文章标签：大模型

本文链接：https://blog.csdn.net/csdnnews/article/details/148303259

版权

整理 | 苏宓

出品 | CSDN（ID：CSDNnews）

昨日，DeepSeek 悄然发布了其 R1 大模型的最新版本——DeepSeek-R1-0528，目前已开启公测。

一贯低调的 DeepSeek 在此番发布时，并未附带详细的技术说明，只是在官方微信社群中告知用户，“DeepSeek R1 模型已完成小版本试升级”，大家可以自行前往官方网页、APP、小程序进行测试。

Hugging Face 地址：https://huggingface.co/deepseek-ai/DeepSeek-R1-0528

但从用户体验反馈来看，本次名曰”小更新“也依然带来了不小的实质性改进，尤其是在推理和输出方面。具体来看，新版的 DeepSeek R1：

推理能力增强：模型在“思维链”（Chain-of-Thought）推理方面表现更为结构化，逻辑性更强。

文本输出质量提升：生成的文本更具条理，语言风格更为成熟，接近 Google 等领先模型的水平。
代码生成优化：在编程任务中，R1 的输出更为连贯，代码质量更高。

对此，Reddit 用户 B89983ikei 在使用后表示：“它在编程方面真的非常厉害！！只用一次对话，就能创建一个完整的游戏，包含多个选项，而且完全可玩！！

我注意到新版 R1 的一个显著变化是……它在编程方面更强了！！但它却在一些（未知的）演绎推理挑战上失败了……这些题它以前可是能答对的！！另一个明显的变化是，现在它在推理时会体现出差异性，而且会用用户的母语思考，不再像以前那样只用英文。”

不过，B89983ikei 也补充道：「对我来说，我很喜欢解决那种偏“抽象”的推理题……所以我觉得这个版本的 R1 反而变弱了。我猜这是因为它现在的思维方式发生了变化……它更专注于精确的问题，反而忽略了更抽象的部分。我不确定这是不是一件好事！！对我来说，这是个倒退……

当我们去掉那些更抽象的思维时，也许就等于在去掉更接近“真实思考”的东西！！如果你能明白我在说什么……有没有其他人也注意到了这一点！？

还有，这次更新的文本格式我也不太喜欢……更让人困惑！！没有以前看着舒服了……用了太多没必要的 emoji！！这些是一个喜欢并一直在用 DeepSeek 的用户的建设性批评！！」

与此同时，也有网友发现新版 DeepSeek R1 在响应时间上略有增加，但多数用户认为这是为了获得更准确结果而值得的权衡。

在进行测试后，还有用户给出了新款 Deepseek R1 的第一个基准测试！

新的 Deepseek R1-0528 在 LiveCodeBench 基准测试中的表现几乎与 o3（high）相当。

X 网友 Yuchen Jin 经过实测还发现，”我的氛围检查：它似乎是唯一能够始终正确回答’9.9 - 9.11 是多少？‘的模型。“

和旧版对比时，OpenRouter 透露，“新版本的 DeepSeek R1 目前已训练至 1 亿 tokens，且还在持续增长，其中还包括一个免费版本！”对比图如下所示：

整体来看，DeepSeek 自 2023 年成立以来，一直在专注打造高性能的通用人工智能模型。像 DeepSeek v3 和 R1 这样的模型，在多个评测中都拿到了很不错的成绩。特别是 R1，它是开源的，采用 MIT 协议，大家可以免费使用、修改，甚至拿来做商业项目，这对于推动 AI 技术的普及和创新有很大帮助。

那么你试用上最新的 R1 模型了吗？感觉怎么样？欢迎留言分享你的使用体验！

📢 2025 全球产品经理大会

2025 年 8 月 15–16 日

北京·威斯汀酒店

2025 全球产品经理大会将汇聚互联网大厂、AI 创业公司、ToB/ToC 实战一线的产品人，围绕产品设计、用户体验、增长运营、智能落地等核心议题，展开 12 大专题分享，洞察趋势、拆解路径、对话未来。

更多详情与报名，请扫码下方二维码。