整理 | 苏宓
出品 | CSDN(ID:CSDNnews)
昨日,DeepSeek 悄然发布了其 R1 大模型的最新版本——DeepSeek-R1-0528,目前已开启公测。
一贯低调的 DeepSeek 在此番发布时,并未附带详细的技术说明,只是在官方微信社群中告知用户,“DeepSeek R1 模型已完成小版本试升级”,大家可以自行前往官方网页、APP、小程序进行测试。
Hugging Face 地址:https://huggingface.co/deepseek-ai/DeepSeek-R1-0528
但从用户体验反馈来看,本次名曰”小更新“也依然带来了不小的实质性改进,尤其是在推理和输出方面。具体来看,新版的 DeepSeek R1:
-
推理能力增强:模型在“思维链”(Chain-of-Thought)推理方面表现更为结构化,逻辑性更强。
-
文本输出质量提升:生成的文本更具条理,语言风格更为成熟,接近 Google 等领先模型的水平。
-
代码生成优化:在编程任务中,R1 的输出更为连贯,代码质量更高。
对此,Reddit 用户 B89983ikei 在使用后表示:“它在编程方面真的非常厉害!!只用一次对话,就能创建一个完整的游戏,包含多个选项,而且完全可玩!!
我注意到新版 R1 的一个显著变化是……它在编程方面更强了!!但它却在一些(未知的)演绎推理挑战上失败了……这些题它以前可是能答对的!!另一个明显的变化是,现在它在推理时会体现出差异性,而且会用用户的母语思考,不再像以前那样只用英文。”
不过,B89983ikei 也补充道:「对我来说,我很喜欢解决那种偏“抽象”的推理题……所以我觉得这个版本的 R1 反而变弱了。我猜这是因为它现在的思维方式发生了变化……它更专注于精确的问题,反而忽略了更抽象的部分。我不确定这是不是一件好事!!对我来说,这是个倒退……
当我们去掉那些更抽象的思维时,也许就等于在去掉更接近“真实思考”的东西!!如果你能明白我在说什么……有没有其他人也注意到了这一点!?
还有,这次更新的文本格式我也不太喜欢……更让人困惑!!没有以前看着舒服了……用了太多没必要的 emoji!!这些是一个喜欢并一直在用 DeepSeek 的用户的建设性批评!!」
与此同时,也有网友发现新版 DeepSeek R1 在响应时间上略有增加,但多数用户认为这是为了获得更准确结果而值得的权衡。
在进行测试后,还有用户给出了新款 Deepseek R1 的第一个基准测试!
新的 Deepseek R1-0528 在 LiveCodeBench 基准测试中的表现几乎与 o3(high)相当。
X 网友 Yuchen Jin 经过实测还发现,”我的氛围检查:它似乎是唯一能够始终正确回答’9.9 - 9.11 是多少?‘的模型。“
和旧版对比时,OpenRouter 透露,“新版本的 DeepSeek R1 目前已训练至 1 亿 tokens,且还在持续增长,其中还包括一个免费版本!”对比图如下所示:
整体来看,DeepSeek 自 2023 年成立以来,一直在专注打造高性能的通用人工智能模型。像 DeepSeek v3 和 R1 这样的模型,在多个评测中都拿到了很不错的成绩。特别是 R1,它是开源的,采用 MIT 协议,大家可以免费使用、修改,甚至拿来做商业项目,这对于推动 AI 技术的普及和创新有很大帮助。
那么你试用上最新的 R1 模型了吗?感觉怎么样?欢迎留言分享你的使用体验!
📢 2025 全球产品经理大会
2025 年 8 月 15–16 日
北京·威斯汀酒店
2025 全球产品经理大会将汇聚互联网大厂、AI 创业公司、ToB/ToC 实战一线的产品人,围绕产品设计、用户体验、增长运营、智能落地等核心议题,展开 12 大专题分享,洞察趋势、拆解路径、对话未来。
更多详情与报名,请扫码下方二维码。