李根 发自 凹非寺
量子位 报道 | 公众号 QbitAI
对撞机,发现新物理粒子的方法和装置。
众所周知的高能物理基础设施,人类基础物理领域研究的集大成成果。
现在,商汤科技也搞了一个,同样是其多年产学研积蓄后的成果转换,是其最新技术成果的集大成体现,是一整套完整的AI基础设施。
取名SenseCore商汤AI大装置。
商汤CEO徐立说,这是商汤长线核心竞争力的标志、公司持续经营和更大规模跃迁的护城河,以及推动AI时代生产要素降低的关键一步。
实际上,企业家一面的徐立对此还显得克制,当他科学家的那一面流露,会激动得语速飞快:
靠人脑的方式可能永远赶不上宇宙膨胀的速度,如果要真正解开宇宙真理,输入的依据就不能单靠此时此地此身的人类有限认知,甚至不必追求当下的过程可解释,可以试着用更大的数据,更强的算力,或许还会撞出更多预期之外的结果。
所以商汤的AI大装置,你可以理解为GPT-3、AlphaFold路径上的更大规模落地,是大数据、大模型和超强算力的三位一体实践,也是input到output之间沿着“大致正确方向”的大力出奇迹。
商汤AI大装置如何组成?
在上海临港新片区,一座宛如芯片的建筑群将在今年年底投入使用。
这是商汤全新的AI算力中心(AIDC),计算峰值速度将达到3740 Petaflops(1 petaflop等于每秒1千万亿次浮点运算)——作为参照,OpenAI的千亿参数模型GPT-3完整训练一次需要3.14E23次浮点运算,而商汤临港AIDC的算力仅在一天内即可完成。
毫无疑问,商汤的这个全新AIDC,目标就是为更大规模参数模型的训练而来。
但在商汤AI大装置中,AIDC不到1/3又1/3。
商汤AI大装置SenseCore的全貌,包含了三层:
算力层(AI芯片及处理卡+AIDC+AI传感器)
平台层(模型生产+训练平台+数据平台)
算法层(算法工具箱+开源框架)
三位一体,以基础设施方式输出模型,把AI能力输出到企业服务、城市管理和个人生活等三大落地方向中。
区别于“AI模型”小作坊式的打造,AI大装置更像流水线工厂,可以实现不同场景的算法模型的底层抽象,以模块化平台套件打造通用型服务平台。
特别是针对AI落地中更长尾的客户和场景,能够在组合不同算法套件的基础上完成新场景的定制,以低边际成本实现对新场景的规模化覆盖。
并且商汤基于AI平台基础设施的系统协同性,可以以半自动化、自适应的方式,就能实现批量的算法模型生产和迭代升级。
为什么商汤要搞AI大装置?
商汤CEO徐立说,本质是让AI落地摆脱人力密集的状态。
他认为AI之所以人力密集,是因为生产效率不高,而生产效率提升的关键,是生产要素的成本能足够低。
在AI落地初期阶段,项目定制是行业最普遍的方式,比如做一个手机检测的算法