支付宝开放平台-开发者社区——AI 日报「12 月 6 日」

1    DeepMind大模型再登Nature:8分钟预测15日天气,准确度超顶尖物理模型,已开源

量子位|阅读原文

DeepMind大模型再登上Nature——气象预测大模型GenCast,8分钟内完成15天的预测,而且不管常规还是极端天气都能分析。和GraphCast一样,GenCast也已经开源。它基于扩散模型实现,分辨率为0.25度经度/纬度(在赤道处约为28×28公里),相当于将地球表面分割成了超过100万个网格。每个网格都涵盖80多个地表和大气变量,相当于每次预测都有数千万甚至上亿条数据生成。测试结果表明,在1320种实验条件中,GenCast在97.2%的任务中,都比ENS更准确。DeepMind研究人员Ilan Price表示:我们确实取得了巨大的进步,通过机器学习赶上了并超越了基于物理的模型。

2   阿里多模态检索智能体,自带o1式思考过程!复杂问题逐步拆解,动态调整下一步检索策略

量子位|阅读原文

阿里通义实验室新研究推出自适应规划的多模态检索智能体——名叫OmniSearch,它能模拟人类解决问题的思维方式,将复杂问题逐步拆解进行智能检索规划。随便上传一张图,询问任何问题,OmniSearch都会进行一段“思考过程”,不仅会将复杂问题拆解检索,而且会根据当前检索结果和问题情境动态调整下一步检索策略。相比传统mRAG受制于其静态的检索策略,这种设计不仅提高了检索效率,也显著增强了模型生成内容的准确性。

OmniSearch的核心架构包括:

  • 规划智能体(Planning Agent):负责对原始问题进行逐步拆解,根据每个检索步骤的反馈决定下一步的子问题及检索策略。
  • 检索器(Retriever):执行实际的检索任务,支持图像检索、文本检索以及跨模态检索。
  • 子问题求解器(Sub-question Solver):对检索到的信息进行总结和解答,具备高度的可扩展性,可以与不同大小的多模态大语言模型集成。
  • 迭代推理与检索(Iterative Reasoning and Retrieval):通过递归式的检索与推理流程,逐步接近问题的最终答案。
  • 多模态特征的交互:有效处理文本、图像等多模态信息,灵活调整检索策略。
  • 反馈循环机制(Feedback Loop):在每一步检索和推理后,反思当前的检索结果并决定下一步行动,以提高检索的精确度和有效性。

3   如何成为一名 AI 产品经理?

Founder Park|阅读原文

产品总监 Aman Khan:曾在 Apple、Cruise、Spotify 担任过产品经理,如今在做一款模型能力和数据检测的平台。对于 AI 产品经理,有足够的发言权。

他表示:

  • 三种 AI 产品经理:平台产品经理、AI Native 产品经理、AI+产品经理,但核心都是要解决问题。
  • 成为 AI 产品经理的第一步:先用 AI 构建出你的第一款产品。
  • AI 时代反倒更需要产品经理,因为最难的部分是知道该做什么,找到那些真正需要解决的机会和问题,然后清晰地传达给 AI 工具该做什么。
  • 不要做别人都在做的事。仅仅因为 ChatGPT 这种界面让大家觉得很直观,大家都喜欢用,也很熟悉,并不意味着这就是你该做的。
  • 好的产品经理不仅要持续地为客户创造价值,还要为自己的团队腾出空间,不断试错、迭代,要接受技术变化飞速的现实。
  • AI不是单纯为了自动化问题,而是让用户的体验变得更简单,降低创造的门槛。
  • 作为AI PM,要学会在不确定中「游走」,不断试探和调整,直到你感受到产品在某个方向上「拖曳」着你往前走。

对此,你怎么看?

详情查看参与互动赢蚂蚁周边


支付宝开放平台-开发者社区

 「AGI 之路」 内容库

欢迎你的投稿!戳我进群


支付宝/钉钉扫码加入支付宝开发者钉组织,可了解支付宝开放能力最新动态,订阅文档更新消息,和同城同行业交流业务,与支付宝产研沟通交流。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值