上帝不掷骰子?商汤科技AI大装置想试试

李根 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

对撞机,发现新物理粒子的方法和装置。

众所周知的高能物理基础设施,人类基础物理领域研究的集大成成果。

现在,商汤科技也搞了一个,同样是其多年产学研积蓄后的成果转换,是其最新技术成果的集大成体现,是一整套完整的AI基础设施。

取名SenseCore商汤AI大装置

商汤CEO徐立说,这是商汤长线核心竞争力的标志、公司持续经营和更大规模跃迁的护城河,以及推动AI时代生产要素降低的关键一步。

实际上,企业家一面的徐立对此还显得克制,当他科学家的那一面流露,会激动得语速飞快:

靠人脑的方式可能永远赶不上宇宙膨胀的速度,如果要真正解开宇宙真理,输入的依据就不能单靠此时此地此身的人类有限认知,甚至不必追求当下的过程可解释,可以试着用更大的数据,更强的算力,或许还会撞出更多预期之外的结果。

所以商汤的AI大装置,你可以理解为GPT-3、AlphaFold路径上的更大规模落地,是大数据、大模型和超强算力的三位一体实践,也是inputoutput之间沿着“大致正确方向”的大力出奇迹

商汤AI大装置如何组成?

在上海临港新片区,一座宛如芯片的建筑群将在今年年底投入使用。

这是商汤全新的AI算力中心(AIDC),计算峰值速度将达到3740 Petaflops(1 petaflop等于每秒1千万亿次浮点运算)——作为参照,OpenAI的千亿参数模型GPT-3完整训练一次需要3.14E23次浮点运算,而商汤临港AIDC的算力仅在一天内即可完成。

毫无疑问,商汤的这个全新AIDC,目标就是为更大规模参数模型的训练而来。

但在商汤AI大装置中,AIDC不到1/3又1/3。

商汤AI大装置SenseCore的全貌,包含了三层:

  • 算力层(AI芯片及处理卡+AIDC+AI传感器)

  • 平台层(模型生产+训练平台+数据平台)

  • 算法层(算法工具箱+开源框架)

三位一体,以基础设施方式输出模型,把AI能力输出到企业服务、城市管理和个人生活等三大落地方向中。

区别于“AI模型”小作坊式的打造,AI大装置更像流水线工厂,可以实现不同场景的算法模型的底层抽象,以模块化平台套件打造通用型服务平台。

特别是针对AI落地中更长尾的客户和场景,能够在组合不同算法套件的基础上完成新场景的定制,以低边际成本实现对新场景的规模化覆盖。

并且商汤基于AI平台基础设施的系统协同性,可以以半自动化、自适应的方式,就能实现批量的算法模型生产和迭代升级。

为什么商汤要搞AI大装置?

商汤CEO徐立说,本质是让AI落地摆脱人力密集的状态。

他认为AI之所以人力密集,是因为生产效率不高,而生产效率提升的关键,是生产要素的成本能足够低。

在AI落地初期阶段,项目定制是行业最普遍的方式,比如做一个手机检测的算法,

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值