商汤科技「工业视觉AI」研发介绍

关注公众号,获取更多AI领域发展机会

本文转载自知乎,已获作者授权转载,请勿二次转载。

链接:https://zhuanlan.zhihu.com/p/352296543

作者介绍

吴立威,商汤科技研发副总监,SCG 事业群工业视觉研发团队负责人。硕士毕业于清华大学自动化系,2014年加入商汤,先后负责过活体检测和身份认证相关算法研发工作。2018年至今,带领团队负责工业视觉相关研发工作,在智能运维巡检、智慧工厂等领域积累了大量落地经验,在工业AI技术体系和小样本学习等方面有研究和实践。

2018年“入坑”工业视觉,从刚开始的“拿着锤子找钉子”到逐步深入行业,发现和解决痛点问题的过程中,形成了一些自己的理解,也有很多感触。长期来看,工业是应该非常具有前景的行业,是国计民生的根基,也是国家间竞争的关键,因此我们决心花5到10年时间,构建全球领先的工业AI技术体系。


当前,工业在国内AI研究领域中似乎还没有进入核心视野,浅层做的话还是挺热闹的,但深入之后就会常常有孤独感。独行快,众行远。希望通过这样的抛砖引玉,找到更多同行交流学习,一起面向星辰大海~

按照传统厂商定义,工业视觉主要包括几个方面的技术:检测、识别、测量、引导。这些国际巨头在工业视觉领域拥有近乎垄断的整体优势,国内同行依然任重道远。


但是长期看,我们认为他们的定义还是比较狭窄的,主要是这些传统国际大厂历史悠久,技术体系反而受制于经验。在这个科技自由迸发的时代,我们有可能重新审视工业AI这个领域。


从算法角度看,我们可以认为工业视觉是计算机视觉的一个子集,但是工业问题的特殊性使得众多新的技术创造成为可能,从而构成未来行业爆发式发展的可能。

检测、识别、测量、引导

以检测为例。问题定义可以简单理解为:算法分析一张图片,然后输出目标位置及其类别标签。在工业检测和常规检测的本质不同在于,工业场景默认所有样本是通过系统的,而常规场景一般默认所有样本是不通过系统的。

以质检为例,流水线默认自动化运转,所有产品都会交付售卖,除非发现异常。常规检测,例如人脸解锁,手机默认是锁上的,除非发现了一个合法的真人脸。对于人脸检测,一般无需关心各种各样的假脸(异常样本)的检测精度,如果一个假脸没有被检测到,系统继续保持关闭就好,如果被检测出来,那就交给后面的活体算法来判断。


而对于工业检测,如果一个异常样本没有被检测出来,后续的流程也无济于事了,就导致了漏报。工业检测如果直接使用常规检测的方法,问题就变成了:加入已知的异常数据,训练检测器,上线,发现没有覆盖的Case,收集数据,重新训练模型,再重新上线,如此往复……无限循环的“脏活累活”,没办法根本解决问题,难以突破工业应用和推广的红线,这也是当前众多厂商觉得做工业很难的原因之一。

另外对于工业检测来说,有一个基本的矛盾:异常越是致命,客户期望精度越高,常规深度学习依赖数据量越大;而实际生产中,越是这样的异常,发生的概率越低,可获得的数据越少。这样的问题我们总称为“工业小样本”问题。

“纯学术”的思路肯定是行不通的,把问题简化,提升几个点,发个paper还行,但是具体工业落地红线还差“十万八千里”。如果想系统解决该问题,“纯学术”只是副产品。

我们需要结合行业,在视觉结构化、小样本学习、半监督、强监督、无监督、数据仿真、大规模自学习、通用工业检测算法等多个方面技术进行持续的研发创新。

我们无监督异常检测方面的工作之一

工业场景还有很多特有的问题,例如:智能机械臂、无人机引导、大数据预测性维护、工业流程控制、工业相机和光源设计(多光谱、多视角、3D等相机)、工业3D仿真等。

要系统解决这些问题,需要的技术往往超出纯视觉的边界,我们正在尝试构建多元化的工业AI技术体系。

机械臂智能抓取Demo

欢迎志同道合的朋友加入我们~

欢迎给我发邮件wuliwei@sensetime.com

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值