DeepSeek R1迎来小更新大升级,性能直逼OpenAI o3!

图片

整理 | 苏宓

出品 | CSDN(ID:CSDNnews)

昨日,DeepSeek 悄然发布了其 R1 大模型的最新版本——DeepSeek-R1-0528,目前已开启公测。

一贯低调的 DeepSeek 在此番发布时,并未附带详细的技术说明,只是在官方微信社群中告知用户,“DeepSeek R1 模型已完成小版本试升级”,大家可以自行前往官方网页、APP、小程序进行测试。

Hugging Face 地址:https://huggingface.co/deepseek-ai/DeepSeek-R1-0528

图片

但从用户体验反馈来看,本次名曰”小更新“也依然带来了不小的实质性改进,尤其是在推理和输出方面。具体来看,新版的 DeepSeek R1:

  • 推理能力增强:模型在“思维链”(Chain-of-Thought)推理方面表现更为结构化,逻辑性更强。

图片

  • 文本输出质量提升:生成的文本更具条理,语言风格更为成熟,接近 Google 等领先模型的水平。

  • 代码生成优化:在编程任务中,R1 的输出更为连贯,代码质量更高。

对此,Reddit 用户 B89983ikei 在使用后表示:“它在编程方面真的非常厉害!!只用一次对话,就能创建一个完整的游戏,包含多个选项,而且完全可玩!!

我注意到新版 R1 的一个显著变化是……它在编程方面更强了!!但它却在一些(未知的)演绎推理挑战上失败了……这些题它以前可是能答对的!!另一个明显的变化是,现在它在推理时会体现出差异性,而且会用用户的母语思考,不再像以前那样只用英文。”

不过,B89983ikei 也补充道:「对我来说,我很喜欢解决那种偏“抽象”的推理题……所以我觉得这个版本的 R1 反而变弱了。我猜这是因为它现在的思维方式发生了变化……它更专注于精确的问题,反而忽略了更抽象的部分。我不确定这是不是一件好事!!对我来说,这是个倒退……

当我们去掉那些更抽象的思维时,也许就等于在去掉更接近“真实思考”的东西!!如果你能明白我在说什么……有没有其他人也注意到了这一点!?

还有,这次更新的文本格式我也不太喜欢……更让人困惑!!没有以前看着舒服了……用了太多没必要的 emoji!!这些是一个喜欢并一直在用 DeepSeek 的用户的建设性批评!!」

图片

与此同时,也有网友发现新版 DeepSeek R1 在响应时间上略有增加,但多数用户认为这是为了获得更准确结果而值得的权衡。

在进行测试后,还有用户给出了新款 Deepseek R1 的第一个基准测试!

新的 Deepseek R1-0528 在 LiveCodeBench 基准测试中的表现几乎与 o3(high)相当。

图片

X 网友 Yuchen Jin 经过实测还发现,”我的氛围检查:它似乎是唯一能够始终正确回答’9.9 - 9.11 是多少?‘的模型。“

图片

和旧版对比时,OpenRouter 透露,“新版本的 DeepSeek R1 目前已训练至 1 亿 tokens,且还在持续增长,其中还包括一个免费版本!”对比图如下所示:

图片

整体来看,DeepSeek 自 2023 年成立以来,一直在专注打造高性能的通用人工智能模型。像 DeepSeek v3 和 R1 这样的模型,在多个评测中都拿到了很不错的成绩。特别是 R1,它是开源的,采用 MIT 协议,大家可以免费使用、修改,甚至拿来做商业项目,这对于推动 AI 技术的普及和创新有很大帮助。

那么你试用上最新的 R1 模型了吗?感觉怎么样?欢迎留言分享你的使用体验!


📢 2025 全球产品经理大会

2025 年 8 月 15–16 日 

北京·威斯汀酒店

2025 全球产品经理大会将汇聚互联网大厂、AI 创业公司、ToB/ToC 实战一线的产品人,围绕产品设计、用户体验、增长运营、智能落地等核心议题,展开 12 大专题分享,洞察趋势、拆解路径、对话未来。

更多详情与报名,请扫码下方二维码。

图片

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

CSDN资讯

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值