在 AI 领域持续创新的浪潮中,产品的更新迭代如同汹涌的海浪,一波未平一波又起。最近,又有几款 AI 产品带来了令人瞩目的更新,为用户的体验和应用场景增添了新的色彩。
DeepSeek R1 小版本升级,性能再进阶
5 月 28 日晚,DeepSeek 官方宣布其 R1 推理模型完成了小版本试升级,这一消息瞬间在 AI 社区中引发了广泛关注。次日凌晨,官方在开源平台 HuggingFace 上发布了 DeepSeek - R1 - 0528。尽管官方尚未更新详细的模型卡以及公告介绍,但开发者们已经迫不及待地投入到测试当中。
从众多开发者反馈的测试结果来看,此次升级效果显著。其中,代码能力的提升最为突出,在代码测试平台 Live Code Bench 中,DeepSeek - R1 - 0528 的性能几乎可与 OpenAI 的重量级 o3 - high 模型相媲美。这一成绩的取得,无疑让众多开源爱好者欢呼雀跃,不少人感慨这是 “开源的巨大胜利”。除了代码能力,在写作任务方面也有明显改进,生成的文本更加自然,格式也更为优化。有用户反映,使用最新模型写作时,之前那种强烈的 “量子力学元素” 减少了,写作过程变得更加顺畅和正常。此外,在上下文 32K 以内的文本召回测试中,新模型的表现也优于之前的 R1 模型,针对给定材料提问时回答的准确度更高。
根据 DeepSeek 内部优化方向和自身的感知,这次升级主要集中在以下几个关键方面:
- 响应质量优化:对于复杂推理和多步骤计算,结果更加准确;在长文理解与生成上,连贯性增强,逻辑更加清晰;在数学、编程等专业性较强的领域,输出内容的可靠性大幅提升。
- 响应速度小幅提升:无论是在网页端、App 还是 API 接口,响应都变得更加敏捷。特别是在处理超长文本输入时,延迟降低了约 10% 至 20%。
- 对话稳定性增强:上下文记忆更加稳定,在超长对话中(支持最多 128K 上下文),减少了偶尔出现的 “遗忘设定” 或 “跑偏” 的情况。
- API 和接口兼容性保持稳定:API 调用方式、参数、返回结构完全不变,用户无需对现有集成进行任何调整,即可无缝使用新版本。
不过,此次升级也存在一些小遗憾。例如,在 60K 的上下文中,模型的效果有所下降。但总体而言,这次 DeepSeek R1 的小版本升级为用户带来了更强大的功能和更出色的体验,也让人们对未来 R2 模型的发布充满了更多期待。
可灵 2.1 上线,性价比与速度双提升
每经 AI 快讯显示,5 月 29 日,可灵 AI 推出了全新的 2.1 系列模型。此次更新带来了诸多令人惊喜的变化,最显著的便是性价比的大幅提升,5 秒视频低至 20 灵感值,且支持 1080P 高清画质输出,为用户提供了更为优质且经济的创作选择。
除了价格优势,可灵 2.1 在性能方面也有亮眼表现,其具备更强的语音响应能力,生成速度达到业内领先水平。这意味着创作者在使用可灵 2.1 进行内容创作时,能够更快速地将自己的创意转化为视频作品,大大提高了创作效率。
自去年 6 月发布以来,可灵 AI 已累计完成超 20 次迭代,全球用户规模突破 2200 万,其影响力与日俱增。在之前的 2.0 版本升级中,可灵 AI 就已在多个方面取得重大突破。可灵 2.0 模型在动态质量、语义响应、画面美学等维度保持全球领先。在文生视频领域,对比谷歌 Veo2 的胜负比为 205%,对比 Meta Sora 达 367% ,在文字相关性、画面质量等关键指标上显著超越对手。同时,发布的 “多模态视觉语言”(MVL) 交互理念,允许用户通过图像参考、视频片段等多模态信息输入,精准传达包含身份、风格、动作、运镜等复杂创意,实现 “所想即所得” 的创作体验。配套推出的可灵 2.0 大师版,新增多模态视频编辑功能,支持在现有视频中灵活增减、替换元素;可图 2.0 图像模型则强化电影质感与艺术风格表现,支持 60 多种风格转绘及局部重绘、扩图等实用编辑功能,满足专业创作与日常修图需求。而此次 2.1 版本的上线,无疑是在 2.0 的基础上,进一步打磨产品,为用户带来更便捷、高效且优质的服务。
扣子空间推播客功能,内容创作更高效
字节跳动旗下的 Agent 协作平台扣子空间在 5 月 27 日晚间推出了一项令人眼前一亮的功能 —— 一键文本生成播客功能。这一功能的出现,极大地改变了播客内容的创作方式,可让创作者几分钟内完成原本需要几个小时的工作,生成 “真人级” 的播客音频。
使用方法非常简单,用户只需在扣子空间的对话框输入转播客的提示词,AI 便能迅速行动起来,通过思考、读取文档、访问链接、搜索话题等一系列步骤,精心策划一个播客选题,然后将其转化为多角色对话的播客音频。
从实际体验来看,扣子空间生成的播客在多个方面表现出色。在科技新闻、文娱热点、养生话题等不同类型的内容创作中,都能达到真人级模拟效果,且内容兼具话题度和深度,能够较为透彻地阐述一个问题或事情。例如,将热点新闻转为播客时,它能快速完成 “规划搜索 + 事件梳理 + 观点点评 + 多角色对话” 的制作流程,对于媒体人来说,在抢新闻时效方面具有很大的帮助。不仅如此,学生和职场人也能利用该功能生成播客,助力学习目标的达成或职场任务的完成。在日常生活中,该功能同样具有广泛的应用场景,比如用户提出情感问题,它能生成心理咨询对话;寻求好物推荐时,可获得导购指引;输入童话文本,还能输出睡前有声书等。扣子空间不仅生成语音播客,还会将相关的礼物推荐文本内容保存为文档,方便用户后续查看和使用。
扣子空间的一键文本生成播客功能以其高效性、便捷性和出色的内容生成能力,为内容创作者和各领域的用户提供了一个强大的工具,开启了播客创作的新篇章。
近期这些 AI 产品的更新,无论是 DeepSeek R1 在性能上的提升,还是可灵 2.1 上线带来的性价比与速度优势,亦或是扣子空间播客功能为内容创作带来的变革,都展示了 AI 领域不断向前发展的活力。这些更新将在不同程度上影响我们的工作、学习和生活,让我们一同期待 AI 技术在未来带来更多的创新与突破。