1️⃣米哈游蔡浩宇新作iPhone实机演示:10分钟就被AI小美撩到脸红,她的命运由我拯救
量子位|阅读原文
米哈游蔡浩宇的AI游戏,实机演示片段曝光!从目前已透出的演示和介绍来看,你可以通过文本、语音、视频等形式与「小美」沉浸式对话。与传统的叙事冒险不同,里面的剧情都是实时展开,并且不受剧本限制。用他们的话来说,你们的对话,决定了「小美」的命运。此次官方发布演示版本的同时,其封闭测试也正在进行中,玩家们可以自行报名申请。不过也有人认为,这是一个有故事设定的聊天模拟器,虽然想法很不错但是感觉不像是游戏。
回到Anuttacon与蔡浩宇,过去一段时间里,或许是人才涌入、AI赋能,可谓是进展十分神速——官宣不到一年,众多大佬加入,团队已接近50人,已有一款AI游戏内测。
已经曝光的加盟大佬包括微软图形学大佬童欣、前B站游戏和直播负责人王宇阳等,还有微软软件工程师、Meta高级技术员、米哈游研究经理等。Infra的主管Erik Li是从小鹏跳槽而来。小鹏建成的中国最大自动驾驶智算中心“扶摇”,他就是主要负责人之一。目前也还在积极招人中。
蔡浩宇决定创业时曾发表过的一则「暴论」。AIGC已经彻底改变了游戏开发,只是需要时间让这种现象完全展开。
2️⃣论文读得慢,可能是工具的锅,一手实测科研专用版「DeepSeek」
机器之心|阅读原文
「未来,99% 的 attention 将是大模型 attention,而不是人类 attention。」这是 AI 大牛 Andrej Karpathy 前段时间的一个预言。这里的「attention」可以理解为对内容的需求、处理和分析。也就是说,他预测未来绝大多数资料的处理工作将由大模型来完成,而不是人类。
如今,当我们拿到一篇论文时,将其交给 AI 进行初步总结,已然成为了一种常规操作。至于选择哪款 AI,顶尖的模型似乎在基础功能上表现得都相差无几。然而,如果想要实现更多功能,例如深入精读或做笔记、存档,很多 AI 就难以满足需求了,因为目前真正为研究场景量身定制的 AI 助手并不多见。这也是为什么「心流 AI 助手」用起来感觉如此与众不同。
我们注意到,每轮问答的右侧都会附带两个特色功能 —— 脑图和播客。在我们的测试中,心流 AI 助手生成的脑图结构非常清晰,适合预览和回顾,而且还能下载为图片、Xmind、Markdown 等格式保存。
当然,这个工具只是初具雏形,还有很多可以改进的功能,比如播客的音色、停顿有时还不够自然,链接到的论文有时不支持直接精读(需要一个上传的操作)…… 相信在未来的版本中,这些小问题都会被一一解决。期待心流 AI 助手的下一波更新。
3️⃣Llama 4训练作弊爆出惊天丑闻!AI大佬愤而辞职,代码实测崩盘全网炸锅
新智元|阅读原文
Llama 4本该是AI圈的焦点,却成了大型翻车现场。开源首日,全网实测代码能力崩盘。更让人震惊的是,模型训练测试集被曝作弊,内部员工直接请辞。
Meta前脚刚发Llama 4,后脚就有大佬请辞了!一亩三分地的爆料贴称,经过反复训练后,Llama 4未能取得SOTA,甚至与顶尖大模型实力悬殊。为了蒙混过关,高层甚至建议:在后训练阶段中,将多个benchmark测试集混入训练数据。
其实,Llama 4昨天开源之后,并没有在业内得到好评。全网测试中,代码能力极差,实力不如GPT-4o。网友Flavio Adamo使用相同的提示词,分别让Llama 4 Maveric和GPT-4o制作一个旋转多边形的动画。
可以看出,Llama 4 Maveric生成的多边形并不规则而且没有开口。小球也不符合物理规律,直接穿过多边形掉下去了。相比之下GPT-4o制作的动画虽然也不完美,但至少要好得多。甚至,有人直接曝出,Llama 4在LMarena上存在过拟合现象,有极大的「作弊」嫌疑。
对此,你怎么看?
支付宝/钉钉扫码加入支付宝开发者钉组织,可了解支付宝开放能力最新动态,订阅文档更新消息,和同城同行业交流业务,与支付宝产研沟通交流。