“世界顶级开源模型”被指欺诈；苹果智能测试时频发错误 | AI头条

最新推荐文章于 2025-05-14 14:43:48 发布

AI科技大本营

最新推荐文章于 2025-05-14 14:43:48 发布

阅读量612

点赞数

文章标签：人工智能

原文链接：https://mp.weixin.qq.com/s?__biz=Mzg4NDQwNTI0OQ==&mid=2247582180&idx=2&sn=1d329da0be7450c89f42a1f9e2abec24&chksm=ce26c355e80d92dd126902c070ec392ccd5e796050c71533c7cce95c17470ea9955623e074a6&scene=126&sessionid=0

版权

整理 | 王启隆

出品 | AI 科技大本营（ID：rgznai100）

一分钟速览新闻点！

iPhone 16 推出，苹果智能软件引关注
xAI 与特斯拉已达成未来收入分成协议，用 AI 技术换取特斯拉软件收入
开源 AI 模型 Reflection 70B 性能遭质疑，被指欺诈
Open Interpreter 放弃 01 Light 硬件转推 01 App
Hugging Face 推出 LightEval 解决 AI 责任问题
文心一言市场负责人否认放弃通用大模型
《人工智能安全治理框架》发布

国内外 AI 要闻

iPhone 16 推出，苹果智能软件引关注

苹果公司今日亮相 iPhone 16，将于 9 月 20 日发布，其 A18 芯片搭载的 “专为苹果智能设计” 的软件成为焦点。该软件能总结信息、写邮件、清理照片等，但在测试中出现诸多问题，如错误信息、编造内容、错误解释文本含义、颠倒人名等，还会把诈骗信息放入 “优先” 收件箱，甚至对图像进行不当编辑。苹果表示正在努力提高其准确性，但目前该软件仍未完成，对于考虑购买 iPhone 16 的人来说，需等待苹果智能找到有用和无意义之间的正确平衡，并了解其对电池寿命的影响。苹果智能在将人工智能引入大众消费产品方面有一定潜力，但也面临挑战，购买需谨慎。

xAI 与特斯拉已达成未来收入分成协议，用 AI 技术换取特斯拉软件收入

埃隆・马斯克的人工智能初创公司 xAI 正与特斯拉商讨一项交易，根据提议，特斯拉可能将部分收入分给 xAI 以换取 xAI 的技术和资源访问权。特斯拉拟授权 xAI 的人工智能模型用于其自动驾驶辅助软件 Full Self - Driving 并让 xAI 协助开发如电动汽车语音助手、人形机器人 Optimus 软件等其他功能，交易条款取决于特斯拉对 xAI 技术的依赖程度。不过马斯克在相关报道发布后否认了这一内容。

马斯克将特斯拉未来押注在机器人技术和人工智能上，其 FSD 服务有收费模式且在开发机器人出租车。若正式合作可能引发利益冲突担忧，已有股东提起诉讼。xAI 从特斯拉雇佣员工，马斯克曾转移硬件资源，xAI 称是特斯拉软件产品关键技术提供商。xAI 今年 5 月获高额融资并推出数据中心，同时特斯拉也在大力投资建设数据中心，目前不清楚与 xAI 的交易对特斯拉支出的影响，且特斯拉在电动汽车市场竞争加剧下销售和利润有所下降。

开源 AI 模型 Reflection 70B 性能遭质疑，被指欺诈

9 月 6 日，纽约初创公司 HyperWrite 的 CEO Matt Shumer 在 X 上宣布 Reflection 70B 是 “世界顶级开源模型”，它是基于 Meta 的 Llama 3.1 或 Llama 3 变体并采用 “Reflection Tuning” 技术。但 9 月 7 日，Artificial Analysis 分析称其 MMLU 分数与 Llama 3 70B 相同且低于 Meta 的 Llama 3.1 70B，Shumer 称模型上传到 Hugging Face 时权重有问题。

9 月 8 日，Artificial Analysis 通过私人 API 测试发现虽有表现但未达最初声称水平，并提出质疑，同时 Reddit 社区用户也对 Reflection 70B 的性能和起源表示质疑，有人指责 Shumer 欺诈，也有人为其辩护，目前 AI 研究社区都在等待 Shumer 的回应以及更新的模型权重。

Open Interpreter 放弃 01 Light 硬件转推 01 App

Open Interpreter 团队做出重要决定，放弃制造 01 Light 硬件设备而推出 01 App。该应用能运行在各种硬件上且可通过语音控制操作设备，用户可按住按钮语音输入远程控制计算机（如 Mac、Windows、Linux 操作系统设备），其具有上下文积累能力，在语音按钮未按下时可累积信息以更好地理解用户指令意图提升准确性。此外，01 App 完全开源，制造材料与开发文档向公众开放，而且它支持多个平台开发，提供包含 React、JS、Unity、Swift、iOS、Android、Flutter、Rust、Next.js 等在内的 SDK 供开发者使用，方便开发者快速构建和集成应用功能。

Hugging Face 推出 LightEval 解决 AI 责任问题

Hugging Face 近日推出轻量级评估套件 LightEval，以帮助企业和研究人员评估大型语言模型。评估在 AI 发展中至关重要，而 LightEval 作为可定制的开源评估套件，能与 Hugging Face 现有工具无缝集成，支持多种设备，具有用户友好性和高级评估配置等特点。它填补了 AI 生态系统中评估工具的空白，推动了开源 AI 在企业创新中的发展，但也面临管理复杂性等挑战。随着 AI 发展，对可靠、可定制评估工具的需求将增长，LightEval 机遇巨大，为 AI 评估设定了新标准，对确保 AI 系统可靠、公平和有效至关重要。

文心一言市场负责人否认放弃通用大模型

针对近日网传百度放弃文心一言背后通用大模型一事，百度文心一言市场部负责人张全文在朋友圈辟谣。张全文表示，所谓‘放弃通用大模型研发’纯属谣言！文心一言刚完成了功能全面升级。我们将持续加大在通用大模型领域的研发投入。百度近日宣布，文心一言 APP 升级为文小言，且在内容生成等方面进行升级。

《人工智能安全治理框架》发布

9 月 9 日消息，从 2024 年国家网络安全宣传周主论坛获悉，全国网络安全标准化技术委员会发布《人工智能安全治理框架》1.0 版。《框架》提出了包容审慎、确保安全，风险导向、敏捷治理，技管结合、协同应对，开放合作、共治共享等人工智能安全治理的原则。针对模型算法安全、数据安全和系统安全等内生安全风险和网络域、现实域、认知域、伦理域等应用安全风险，《框架》提出相应技术应对和综合防治措施，以及人工智能安全开发应用指引，为促进人工智能健康发展和规范应用，提供了基础性、框架性技术指南。(央视新闻)