1️⃣AI时代不看独角兽,看10亿Tokens日均消耗
量子位|阅读原文
大模型时代中,类似的新价值红线也正在形成——日均10亿Tokens消耗量,AI业务跑通的基本标准。这意味着,大模型时代的“抢风口”大战告一段落,真正具备价值参考的商业模式开始明确。
各个垂直领域的先行者能够找到场景,做到单日至少消耗10亿Tokens,就是最直接的证明。不过问题是,日均10亿Tokens基准线,why?
首先来计算下,日均10亿Tokens消耗量是什么概念?参考DeepSeek API文档中给出的标准:1 个英文字符 ≈ 0.3 个 Token。1 个中文字符 ≈ 0.6 个 Token。10亿Tokens约代表16亿+汉字。换算成对话量,一本《红楼梦》的字数在70-80万左右,相当于一天和AI聊了2000本《红楼梦》的内容。
如果是To C应用,100万次响应背后,至多将是100万DAU。
如果来到终端场景,Tokens的消耗方式则变得更加多元。AI手机中除了智能助手,还有各种渗透在系统里的AI功能,比如一键路人消除、通话总结、一键识屏等。据OPPO 2024年10月数据,小布助手月活突破1.5亿。更进一步,云厂商披露的Tokens调用量以及合作客户情况也为这一基准提供参考。2024年7月,腾讯混元披露单日调用量达千亿Tokens(包含自身业务)。
由此,单个企业日均10亿Tokens消耗成为一条非常有价值的参考线。
第一,它代表大模型应用落地新趋势,企业拥抱大模型红利,要朝着这一数字前进;
第二,它成为大模型应用落地新阶段的门槛,AI业务真正跑通了吗?需求真实存在吗?都可以此为参考系找回答。
第三,日均10亿Tokens消耗也只是大模型落地“入门级水准”,单客户百万亿、千万亿Tokens消耗是更值得期待的星辰大海。
只是随着这一新价值基准形成,谁能成为大模型落地的“独角兽”,能更清晰判断了。
2️⃣李飞飞:语言之外,另一半的智能还有待实现
机器之心|阅读原文
「语言是人类的语言,而 3D 是自然的语言。」「除了语言,我们还有另外一半智能,这部分非常深刻,就是我们做事的能力。」「在 AI 之间加一个 G 以强调其通用性,我是尊重这个想法的。从制造能够思考和帮助人们做出决策的机器的角度来看,AI 或 AGI 对我来说是同样的事情。」——李飞飞
探究智能的本质,李飞飞认为智能分为说话的能力和做事能力,与之对应的是语言智能和空间智能,语言是人类的语言,而 3D 是自然的语言。而拥有空间智能的 AI,将做到人类从未做到的事:真正地打破物理世界和数字世界的界限。
对于人类和 AI 技术安全的关系,李飞飞认为首先要考虑的是,我们应该基于科学,而不是科幻。对于 AI 治理,精力应集中在应用层面设置护栏上,也就是人类受到影响的地方,而不是阻止上游开发。其认为只有当拥有正面的生态系统时,才会有正面的 AI 未来,这需要服务于公众福祉的公共部门参与。其分为两种形式:一是推动基础研究和创新,从医疗到教育;二是人才,需要教育越来越多的年轻人和公众了解这项技术。
3️⃣截胡OpenAI!清华复旦等抢先开源智能体框架Eko,一句话打造「虚拟员工」
新智元|阅读原文
OpenAI的首席执行官Sam Altman最近宣布,2025年将推出「虚拟员工计划」,代号Operator,AI智能体能够自主执行任务,如写代码、预订旅行等,成为企业中的「数字同事」。
抢在OpenAI发布Operator之前,清华、复旦和斯坦福的研究者联合提出了名为Eko的 Agent开发框架,开发者可以通过简洁的代码和自然语言,快速构建可用于生产的「虚拟员工」。AI智能体能够接管用户的电脑和浏览器,代替人类完成各种任务,为工作流程提供自动化支持。
核心技术创新有三点:
- 混合智能体表示:提出了Mixed Agentic representation,通过无缝结合表达高层次设计的自然语言(Natural Language)与开发者低层次实现的程序语言(Programming Language)。
- 跨平台Agent框架:提出环境感知架构,实现同一套框架和编程语言,同时支持浏览器使用、电脑使用、作为浏览器插件使用。
- 生产级干预机制:现有Agent框架普遍强调自治性(Autonomous),即无需人类干预,而Eko框架提供了显性的生产级干预机制,确保智能体工作流可以随时被中断和调整,从而保障人类对生产级智能体工作流的有效监管和治理。
对此,你怎么看?
支付宝/钉钉扫码加入支付宝开发者钉组织,可了解支付宝开放能力最新动态,订阅文档更新消息,和同城同行业交流业务,与支付宝产研沟通交流。