支付宝开放平台-开发者社区——AI 日报「12 月 18 日」

1   谷歌版Sora来了,4K高清暴击OpenAI!视频生图新卷王,更理解物理世界

新智元|阅读原文

昨天,谷歌再次爆打OpenAI。全新发布的Veo 2,实测效果已经被许多人公认「超越Sora」。作为谷歌最先进的视频生成模型,Veo 2更好地理解现实世界物理和运动的细微差别,理解电影摄影语言的能力(如镜头类型和效果),分辨率高达4K。

同时放出的,还有Imagen 3图像生成模型,和用图像而非文本作为prompt的工具Whisk。无论是在LLM上,还是在视觉创作上,谷歌正在缩小和OpenAI的差距。

举个栗子,我们用相同的提示「A pair of hands skillfully slicing a ripe tomato on a wooden cutting board」生成一个切西红柿的视频。在Veo 2中,西红柿不仅会随着刀子的前后移动而移动,并且其横断面清晰可见。切片虽略显厚实,但前后始终保持一致,而且还能正确地叠放起来。相比之下,Sora不仅照着手指疯狂下刀,而且切了半天的西红柿依然「完好无损」……

难怪有网友说,在理解物理世界和一致性上,Veo 2已经到了next level。高达4K的分辨率,大大提升的细节和真实感,人体动作和表情的改善,以及更好的物理建模和时间一致性,都让Veo 2达到了顶级AI视频模型的级别。

2   AI大模型时代,人才的需求已经变了

机器之心|阅读原文

什么是 AI 发展的第一驱动力?最近,全球科技大厂都在用行动告诉我们:人才。

然而,现实却给了我们当头一棒 —— 承载期望的 Killer App 依然未能现身。对于抖音、快手这些国民级内容社区,AI 并未带来预期中的实质性变革。调性与 AIGC 最契合的小红书,今年也放弃了旗下的 AI 生图工具 Trik AI。

投资人越来越迟疑,「AI 六小龙」已有三家选择了战略性放弃 C 端业务线。为什么会这样?让我们从最基础的问题谈起。很多公司在开发 AI 产品时,总是习惯性「拿着锤子找钉子」。他们练就了一身本领,就着急要找地方施展,但却没考虑过用户的真实需求。

究其原因,AI 技术的研发者和从业者之间存在难以跨越的认知鸿沟 —— 术业有专攻,许多需求早已内化为肌肉记忆般的本能反应,往往是「问不出来」却「离不开」的隐性知识。一切症结都指向了同一个结构性矛盾:懂行业场景的「老师傅」不懂 AI,而精通 AI 技术的人又不了解行业里的人需要什么。如果无法化解,AI 落地就将持续面临「最后一公里」的挑战。

帮大模型「立三观」需要行业、AI 一起来。显然,双向奔赴才是更好的选择。换句话说,这也意味着能够帮助大模型建立「三观」的人,最好是懂 AI 的行业专家。培养复合型行业 AI 人才是我们未来要做的。

3   从骁龙8至尊版,我看到了AI手机的未来 | 智在终端

量子位|阅读原文

如果说此前市场对于AI手机还有“蹭大模型热度”的犹豫和质疑,那么如今各大厂商都在用实际进展证明:端侧AI,已经成为手机新的竞争焦点。而如此时间节点的如此变化,反映的一个事实是,应用侧的坚定AI化,背后更关键的信心来源之一,依然是底层硬件的变化。

作为新一代手机最强芯,骁龙8至尊版的核心目标很明确:全面重构性能、全面重构AI首先,是真正“知你所言,懂你所想”的个性化多模态AI助手

就像手机厂商们正在竞相宣传的那样,大模型加持下的AI助手,不仅仅是“听得懂人话”版的增强型语音助手,更关键的是,它能充分挖掘用户在手机端留存的个性化数据,通过分析用户的操作、语音等信息,在准确感知、理解用户意图的基础之上,变革人机交互体验——从单一场景到多场景、多任务,甚至是从人找服务到AI助手主动为人做策划。

简单总结一下,在骁龙8至尊版支持下,AI手机在以下几个维度有了明显提升:

  • AI运行速度
  • 多模态交互
  • AI Agent(智能体)“自动驾驶”

但是底层计算只是实现这一切的基石。软件层面,先进算法和海量工具,是生成式AI应用得以繁荣的另一大关键。

在这里,移动计算被重构,移动计算的发展方向也更加明了——当AI成为移动设备的全局性能力,更强大的CPU将成为必需,小核已经成为过去时。NPU作为天生为AI而来的硬件核心,负责为多模态、超长文本等能力提供支持。GPU则继续在擅长的游戏、图像领域发挥能力。当然,为了满足AI模型运行的需求,大内存也成为必然。

对此,你怎么看?

详情查看参与互动赢蚂蚁周边


支付宝开放平台-开发者社区

 「AGI 之路」 内容库

欢迎你的投稿!戳我进群


支付宝/钉钉扫码加入支付宝开发者钉组织,可了解支付宝开放能力最新动态,订阅文档更新消息,和同城同行业交流业务,与支付宝产研沟通交流。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值