对话 CTO | 听码隆科技 CTO 码特讲计算机视觉技术赋能全球零售行业

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/ones_ai/article/details/93412278

专栏介绍

「对话 CTO」是极客公园的一档最新专栏,以技术人的视角聊聊研发管理者的发展和成长。

本专栏由企业级研发管理工具ONES的创始人&CEO王颖奇作为特邀访谈者。王颖奇曾参与金山软件 WPS、金山毒霸等大型软件的核心开发工作;2011 年创立了正点科技,旗下产品正点闹钟、正点日历在全球用户过亿;2014 年,王颖奇在知名美元基金晨兴资本任 EIR,并以个人身份参与十余家公司的管理咨询工作;2015 年,王颖奇创立 ONES,致力于提供企业级研发管理工具及解决方案。

 

摘要

成立于 2014 年的码隆科技是一家提供计算机视觉技术服务的人工智能公司。区别于市面上做安防、金融等人脸识别的人工智能公司,码隆科技将核心技术围绕着商品识别展开。2016 年码隆科技发布了 ProductAI 人工智能商品识别平台,目前技术已经在零售、纺织服装、质检等多个领域落地。在码隆科技 CTO 码特(Matt Scott)看来,务实的 AI 才能真正带来商业价值。

码特曾任微软亚洲研究院高级研发主管,拥有超过 90 个中美专利技术。在职业生涯的黄金时期,码特与同事黄鼎隆组成「中美创业」组合,创立码隆科技。除了产品研发,码特还带领团队参与了很多科学研究项目。码隆科技通过自主研发的弱监督学习算法解决了深度学习需要大量人工标注来支持的难题,因此取得了 WebVision 全球图像识别竞赛的冠军,识别正确率达到了 94.78%。

出生于美国,在中国工作了 13 年的码特认为,AI 无国界,技术解决的是全球性的问题,具备全球化视野和格局是 AI 行业企业家的挑战和必备素养。

 

从微软亚洲研究院走出来的 CTO

 

 

颖奇:非常感谢码隆科技 CTO 码特接受我们的采访。您作为一个在中国创业做 AI 技术的美国人,能否先简单介绍一下您在 AI 领域中的成长经历和故事?

码特:计算机视觉一直是我的兴趣,我在 20 岁左右就发表了 CVPR 论文。我在毕业后就进入美国微软,之后又转到中国,去追寻我在计算机视觉领域的梦想。我在微软亚洲研究院的第一个项目是做条形码识别,是为 Pocket PC 写一维和二维的解码器。这个经历让我想到了零售行业,因为零售业的类似场景有很多,但我当时做的工作还属于传统的计算机视觉。

我在微软研究院工作的过程中,有机会接触到最前沿的事物。2012 年,我在天津展示了微软研究院的即时翻译技术——我说英语的同时,AI 程序可以实时翻译成中文,我非常荣幸见证这一时刻的到来,这也让我看到了未来 AI 将是一个大趋势。

在微软亚洲研究院工作了八年之后,我和最好的朋友兼同事黄鼎隆博士发现 AI 创业的最佳时机到了。码隆科技创立于 2014 年,「码隆」是由「码特」的「码」和「鼎隆」的「隆」组成,当然还有另外一层含义就是「码农」。后来,虽然我离开了微软去创业,但仍然是关系紧密的微软校友。同时,码隆也是微软加速器第六期的企业学员,是微软创新计划的一部分。

公司初创时,只有鼎隆和我联合创始。我们参加了中国科技部主办的中国创新创业大赛,在一万家公司中我们获得了第二名。然后在下一个月我们又参加了深创赛,这次获得了第一名。我们觉得是时候了,然后逐渐整备资源,让公司运营逐步走上正轨。

颖奇:能否介绍一下码隆科技的研发团队大概是什么样的规模,内部人员的组织架构是怎样的?AI 对技术人才的要求很高,码隆又是怎样聚拢一批优秀人才呢?

码特:我们公司大概 150 人,其中有 70% 以上是核心研发人员。聘请职业管理者相对容易,招聘优秀的人才却很难,所以我的策略是努力吸收那些顶尖的人才。我们团队中大多数人都是一起共事多年的朋友。很多人说,人脉来来往往经常流动,而我却发现人们会留下来像家人一样相处,一起努力解决不可能的问题。这样的凝聚力是一种非常棒的价值传达。

颖奇:能否提供一些工作中的学习方法和建议给年轻一代的工程师和研究人员?有哪些书是会推荐给大家的?

码特:我的建议是不要走捷径,真正建立核心知识体系和技能。如果想读书,就读课本,而不是那些花哨的书。我们需要基础知识,即使你没有经验也没关系,但是你需要对它的工作原理有一个基本的了解。

在此,我也推荐一本关于 AI 的好书,叫做《机器与人》(《Human + Machine: Reimagining Work in the Age of AI》),它描述的是和人工智能一起工作的未来,告诉企业如何使用人工智能来改变我们的工作方式。

当然,如果你能找到一个导师就再好不过了。但人工智能是一个新领域,所以很难有人在人工智能领域有十年的经验。在人工智能中,你必须愿意走进未知世界,必须愿意尝试一些新东西。

 

从计算机视觉的行业领先者到基准创建者

颖奇:能否请您简单介绍一下码隆科技在 AI 领域上的技术创新和整体情况?

码特:码隆科技是世界上领先的人工智能计算机视觉公司之一,区别于市面上做人脸识别的人工智能公司,我们专注于商品识别。这是一项能够支持零售和其他场景的核心技术。

起初,我们从服装开始做起,识别不同颜色和纹理并不容易,同时服装还非常容易产生褶皱、折叠等变形。我喜欢挑战,所以我想如果能识别出流行与时尚这样抽象的概念,我就能识别一切。我们目前已经专注在这个领域近五年的时间了,我们将服装识别的技术延伸到全品类的商品识别,我们的技术现在可以精准识别面料商品的花型及纹理材质,对于场景中的服饰商品可以反馈几十种品类,比如雪纺上衣、双肩包、运动鞋等。同时,我们在对商超、货柜、购物中心等场景中的商品也能进行精准识别,为零售商提供智能结算、资产保护等服务。现在我们的业务已经扩展到各个细分领域的龙头企业中,今年专注于项目落地,明年会进行大规模行业范围复制。同时,我们也参与了很多科学研究项目,积极为学术界贡献力量,再将科学研究和产品研发更好地结合在一起。

颖奇:现在国内有很多专注于做计算机视觉的公司,码隆在技术或效率上有哪些优势呢?有没有一些基准(benchmarks)或技术参数?

码特:我们不断用现有的学术基准来测试自己,挑战自己——这是我们文化的一部分。在学术界,有很多关于商品识别的评估基准,我们的结果都处于业界最领先的位置。同时,我们也发表了很多研究成果,并且在 CVPR、ICCV 和 ECCV 等计算机视觉世界顶级行业会议上接受同行的科学评审。而这些前沿技术,也被我们充分应用到技术服务之中。

从去年开始,我们创建了自己的评估基准。最近我们举办了一项有关商品识别的比赛 iMaterialist Challenge on Product Recognition,截至目前全球已有一百多支代表队参赛,这项比赛的结果将在世界顶级会议 CVPR 上进行公布。同时,这也是 CVPR 迄今数据规模最大、种类最多的商品识别竞赛。

(采访期间,码特向颖奇展示了 MeasureAI 自动化服装测量解决方案。MeasureAI 是一套可扩展、经济高效的自动化服装测量解决方案。码隆拥有专有的深度学习模型能够定位衣服关键点,如衣领、肩膀等,并利用尖端的计算机视觉技术将像素距离转换为毫米级别的测量值。基于码隆的商品识别能力,它还可以区分衣服的款式类型。使用者只需要通过拍照进行服装测量,几秒钟内即可得到服装测量结果,全程无需手动输入数据。)

 

放眼全球,深耕行业痛点

颖奇:码隆更多是帮助其他人来使用 AI,所以我想到了「AI 民主化」这个话题,即能够让更多人来使用 AI。码隆在这个方向是否做了一些努力?

码特:我们不仅重视在 AI 行业中建立影响力,更重视 AI 给其他行业带来的影响。ProductAI 是我们最早大众化的产品,是一个商品识别平台。但后续我们的战略上有一些聚焦,更专注于服务各个行业的龙头企业,可以帮助他们解决计算机视觉和商品识别的业务问题。因为我们发现通用产品解决的是相对浅层的问题,如果要想给行业带来变革,就一定要深入到行业中去。比如我们现在的 RetailAI 重点聚焦于零售行业,StyleAI 重点聚焦于服装纺织行业等,之后会有更多专注于垂直行业深度探索的定制化开发。

颖奇:同一个领域里不同客户的相似性有多少?或者他们也都有不同之处?

码特:我们在零售行业做得很深,从我们观察来说,每个公司,尤其是创业公司的能力是有限的,大家一开始就用新的技术和不同的行业去进行碰撞和尝试。而在后期的话,随着公司的体量不同和发展策略有所变化,一定要去解决最贴近他们的实际问题才能够走下去。现在的 AI 公司都会有一个更加聚焦的成长趋向。

颖奇:能否分享一下您认为的 AI 或者 ProductAI 在未来五年的产品形态?会为类似的垂直行业提供怎样的产品和解决方案?

码特:之前,AI 是「酷」的代名词,现在 AI 是「真」的代名词。解决真正的问题,才是一个健康的产业。我不认为你会想看到比如一些疯狂的科幻小说里的科幻场景,你想看到的是一些能带来真正价值的东西,特别是为客户、大企业解决真正的问题。因此,我们未来五年的目标是用 AI 为世界大型企业解决问题,尤其是在零售业,他们尤为重视成本效益和实用性。

颖奇:那么码隆是如何应对在中国市场中遇到的困难和挑战?

码特:我们每天都遇到挑战,也一直努力在解决问题。对于一些项目,比如像智能货柜,其中一个主要问题便是如何高效、低成本进行商品上新。假设你有了一个新商品,它不仅要能够被识别出来,而且还必须高效地将商品录入系统中。现在很多人做这个需要成百上千张图像数据来进行训练,而我们只需要 20 张图片就能实现同样的效果,所以我们减少了很多空间和时间成本,这正是我们攻克的核心技术难点之一。

这背后的技术就是弱监督学习(Weakly Supervised Learning)。现在大家都认为,如果我想做一个图像识别或相关场景,需要收集大量图像数据,并需要对应准确无误的标签支撑。但在码隆,我们有自己的弱监督学习算法 CurriculumNet,能够有效处理有噪音数据和数据不均衡的情况。基于这类的基础研究,我们把这些成果应用到智能货柜的商品信息录入上,使之得以更高效的运转和工作。

颖奇:在中国解决了这些问题后,是否能把这种能力扩展到全世界范围?

码特:我认为我们解决的不仅仅是中国问题,而是全球性的问题,像商品识别和商品信息录入这些问题都是全球性的。总的来说,我不喜欢说中国的 AI,或者美国的 AI,法国的 AI……AI 就是 AI,是世界的。

颖奇:今天的前沿科技领域,需要企业家具备全球化的格局。感谢您的分享。

 

本文作者:王颖奇

联系方式:wangyingqi@gmail.com

 

关注「万事ONES」微信公众号,查看更多「对话CTO」文章

展开阅读全文

没有更多推荐了,返回首页