李根 发自 凹非寺
量子位 报道 | 公众号 QbitAI
旷视者,大视觉之谓也,现在更能显出这家AI独角兽的抱负和野心了。
就在昨天(8月8日),旷视发起了一场“3D视觉产业先锋研讨会”,并正式对外推出了“软硬一体”的移动端3D感知全栈解决方案。
从算法、应用开发、芯片、摄像硬件、传感设备到解决方案,现在万事俱备,只待AI加速下的3D视觉迎来杀手级应用的爆发。
自深度学习“开天辟地”以来,自2D图像、视频被AI结构化解析以来,视觉领域已有天翻地覆的变化。
但旷视雄心不止于此,新世界、新方向是什么?
3D视觉。
△ 旷视移动端产品矩阵架构
全栈方案
在旷视推出的解决方案中,包含了3D视觉发展的一整套所需。
首先是算法。
旷视会集中于识别和重建2个大类。
识别即机器感知、理解世界的能力,这是旷视的强项,基于旷视自研的MegBrain深度学习引擎,之前旷视在人脸识别、人体识别、活体检测、注意力检测追踪及其他图像识别的算法层面,已有业界公认的技术基础。
重建是把识别出的物体进行三维重建,是开发针对人、针对物的3D视觉应用核心所在。旷视称,目前已在人像3D建模、人体3D建模及物体几何测量算法研发方面走在世界前列,并与Bellus 3D、Altizure等3D视觉企业开展了联合研发合作。
其次是解决方案。
毫无疑问,不同应用场景需要不同的3D视觉解决方案,基于此,旷视根据不同应用场景中对深度计算、深度修复、深度优化、标定、畸变校正等能力的需求,设计出了基于双摄、三摄、深摄的解决方案,而且之前在整合结构光、TOF、双目等不同的摄像、传感系统架构上,都有成熟应用经验。
第三是硬件模组。
硬件制造处于移动端3D产业链最底层,包含摄像头、传感器、芯片等硬件模组的研发。
结构光、TOF和双目方案涉及到高清摄像头、IR投射器、IR接收器、激光发光器等设备的搭配组合,旷视目前与艾迈斯半导体等3D硬件模组厂商展开合作。
此外,还将联合主要芯片厂商合作研发算法适配性更强的芯片,进一步优化手机3D应用能力。
最后,基础条件兼具,应用其实已如雨后春笋。
3D视觉究竟能做什么?怎么实现价值?旷视认为,目前旷视在3D人脸识别解锁和3D人像光效应用方面,已经实现了大规模的应用,并且还开发出全面可用的安全支付、3D 美颜、3D 整形等应用。
下一步,AR游戏、虚拟试穿等应用上,还能持续有3D赋能手机的更多应用。
所缺的是更多合作伙伴和开发者。
创新应用开发
整个研讨会上,有种工具已齐备,但创新性应用还只是潜力初现之感。
作为此次“AI+3D”研讨的召集人,旷视也请到了几家合作伙伴及开发者,分享了具体实践。
△ Bellus 3D创始人Eric Chen
Bellus 3D,一家来自于硅谷的移动端3D面部扫描企业,其创始人Eric Chen是苹果公司Quicktime VR 项目的创建者之一。
2015年,Eric Chen创建Bellus3D,专注于为手机等移动设备提供高解析度的3D人脸扫描、建模技术和产品。
Eric Chen针对Bellus 3D的实践分享是:“Bellus 3D 是最早采用‘active stereo’(主动式立体)深度感测技术打造3D面部扫描相机的企业,通过将 Bellus3D研发的3D面部扫描相机与智能手机或平板电脑连接就可以检测人脸上的50万个3D点,在几秒钟内创建出高分辨率和高精确度的面部模型,同时扫描后的面部模型可以进一步应用于人脸的识别、分析和动画制作。”
Eric Chen认为,当前3D产业的技术和硬件研发进入快速发展期,研发3D扫描器不再像以前一样昂贵、难做,3D应用或许现在还不能完整清晰的面貌,但未来人手一台三维扫描器后每个人都将成为应用的开发者,可能性无限。
△ Altizure联合创始人兼CEO方天
Altizure,深圳珠科创新技术有限公司,是三维重建技术应用系统集成商和网络解决方案提供商。
Altizure平台主要通过计算机视觉技术来识别图片中的信息,加以人工智能以及深度学习技术来实现二维图像到三维模型的建立工作。目前该平台已拥有来自全球各地成千上万个3D重建模型。通过一架无人机,就能实现某个建筑、地点的3D模型绘制,打造的是一个众包版的Google Earth.
Altizure联合创始人兼CEO方天说:“自2015年上线以来,Altizure已经和众多大型工程企业合作为其提供项目工程的三维建模服务,帮助提高建筑效率和质量。今后Altizure将在户外运动、旅游、游戏、影视、三维打印,自动驾驶、高精度地图等领域,联合行业合作伙伴一起继续三维建模技术和应用的创新研发。”
△ 上海叠镜数字科技CEO洪煦
还有一家汇集了虞晶怡、马毅等机器视觉大牛的上海叠镜数字科技,公司CEO洪煦分享说,目前在电商商品3D图像构建、明星3D形象绘制方面,都开始进入了商业化应用。
而且底层芯片硬件方面,其实也已感知到了潮向。
此次现身研讨会现场的传感器解决方案提供商艾迈斯半导体透露,过去一年营收增长的70%都主要来自于手机市场,其中手机3D摄像模组的应用贡献了巨大力量。
此外,艾迈斯半导体在中国的业务也实现了300%的增长,也是得益于中国手机市场对传感模组的需求增长。
总之,AI+3D视觉,看起来路通桥建,渠也通畅。
但不意味着发展没有挑战。
缺组织者
最大的挑战在于组织者缺乏。
在研讨会现场,嘉宾们被问及AI+3D视觉的“杀手级”应用何时能到来。
旷视SVP吴文昊认为,最关键的问题不在技术准备层面,而在产品应用方面。
以3D视觉目前最广为人知的“刷脸解锁”为例,在iPhone X发布前,其实数家国内安卓厂商就已经向旷视提出了诉求。
但相比苹果有整一套方案的上下游构建能力,安卓阵营里缺乏实际组织者,都是OEM厂商先主导提需求,再向行业不同参与方要方案,产品方案最后出炉需要耗费的时间和精力可想而知。
所以在陪OEM厂商完整推出3D视觉方案后,旷视开始意识到,这个生态平台,需要一个承担更多责任的组织者和号召者。
△ 旷视高级副总裁吴文昊
于是时也运也,旷视决定将“AI+3D”的生态平台组织、维护和应用创新引导,揽责任于自身。
旷视想做的,就是在整个产业上下游中,整合软件、硬件、算法、应用,让3D视觉从技术到产品的落地速度进一步提升。
说白了,3D视觉的终端应用,iOS阵营里整合者是苹果,那安卓阵营里,是旷视。
所以这套3D感知全栈解决方案发布,也便自然而然。
可以肯定的是,这只是开始,如果旷视能团结更多产业上下游公司加入,AI+3D视觉,会有更多应用,会出现在更多设备,也会造出一个更立体的世界。
你怎么看旷视的这一步?
作者系网易新闻·网易号“各有态度”签约作者
— 完 —
加入社群
量子位AI社群19群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;
此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。
进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态