1️⃣阿里云造“Agent工厂”,百炼MCP服务上线,无需代码5分钟人人都可搭建Agent
量子位|阅读原文
AI大模型在咖啡店怎么落地?不是辅助设计宣传海报or制定营销策略,新姿势是:帮忙质检,不仅包括产品质量,还包括每个店面当前实时的运行情况。比如库迪咖啡,门店数量众多巡检成本高,为了给顾客提供更好的店面环境、产品质量、人工服务,就用上了AI智能检测。
刚刚,在阿里云AI势能大会上,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光介绍了AI大模型的社会价值在企业市场释放的一系列最新成果和新趋势。在上述质检任务中,AI大小模型协同,视觉专家小模型负责业务目标的理解,通义千问VL大模型负责通用场景理解,还有阿里云提供的异步工程链路提高吞吐量,AI质检整体准确率达95%,事件准确率达80%。为加速AI落地最后一公里,在大会现场,阿里云宣布百炼上线业界首个全生命周期MCP服务。
MCP已被公认为大模型连接软件应用的标准协议。据介绍,尽管国内外顶级科技企业相继推出基于MCP协议的Agent应用,但这些Agent应用仍无法解决千行百业真实场景的需求。企业和个人都需要针对专属场景定制一个具备自主思考、任务拆解、决策执行等能力的Agent。阿里云百炼上线的MCP服务可快速让大模型转化成真实场景的生产力工具。
2️⃣AI封神了!无剪辑一次直出60秒《猫和老鼠》片段,全网百万人围观
机器之心|阅读原文
AI 圈永远不缺「新活」。这两天,加州大学伯克利分校、斯坦福大学、英伟达等机构联合制作的《猫和老鼠》AI短片火了。
据论文另一位共同一作 Gashon Hussein 介绍,为了实现逼真的动画效果,他们利用 TTT(Test-time Training,测试时训练)层来增强预训练 Transformer,并进行了微调,从而生成了时间和空间上连贯性很强的《猫和老鼠》一分钟短片。尤其值得注意的是,所有视频都是由模型一次性直接生成,没有进行任何二次编辑、拼接或后期处理。
Gashon Hussein 进一步解释了背后的技术原理。TTT 层是专门的 RNN 层,其中每个隐藏状态代表了一个机器学习模型。此外,这些层内的更新使用梯度下降来完成。
3️⃣面向AI Agent的浏览器怎么做?创业机会在哪里?
Founder Park|阅读原文
浏览器的使用者正在逐渐从人类用户转移到 AI Agent,Agent 与互联网环境互动的底层设施也因此正在变得越来越重要。传统浏览器无法满足 AI Agent 自动化抓取、交互和实时数据处理的需求。Browserbase 的创始人 Paul Klein 早在 23 年底就敏锐地洞察到 AI Agent 亟需一个全新的交互载体——一个“为 AI 而生”的云端浏览器。这个浏览器不仅要解决现有工具的性能和部署问题,更核心的是要利用 LLM 和 VLM 赋予浏览器理解和适应网页变化的能力,让 AI Agent 能用更接近自然语言的方式与之交互,稳定地完成任务。
Browserbase 是一家成立一年多的 headless browser 服务提供商,以云服务的形式为 AI Agent 公司提供 scalable、高可用性的浏览器服务。近期,Browserbase 又推出了 StageHand,一种利用 LLM 使得开发者可以用自然语言与网页进行交互的框架,进一步拓展了其在 headless browser 领域的影响。
如 a16z 合伙人 Alex Rampell 所说:“每家初创公司与现有巨头之间的竞争,本质上就是看创业公司能否在巨头实现创新之前,抢先获得市场分发。”如果没有强有力的 GTM 策略就无法获得成功,“首次创业的人痴迷于产品,二次创业的人则专注于分发。”针对开发者工具类产品,最有效的分发策略如下:1)打造一流的产品;2)通过开源投资于社区;3)建立值得信赖的品牌;4)教育并赋能开发者
对此,你怎么看?
支付宝/钉钉扫码加入支付宝开发者钉组织,可了解支付宝开放能力最新动态,订阅文档更新消息,和同城同行业交流业务,与支付宝产研沟通交流。