Computer Graphics and Vision - Technical Annovation

前Google资深研究员赵勇回国创业 专注计算机视觉/模式识别

发表于 4小时前次阅读| 来源 CSDN8 条评论| 作者 付江
摘要:日前,前Google Research研究员、格灵深瞳创始人赵勇在CSDN参加主题为“可穿戴计算”的视频谈话节目间隙接受了记者采访,谈到了自己在国内的创业项目。

CSDN报道(付江/文)日前,前Google Research研究员、格灵深瞳创始人赵勇在CSDN参加主题为“可穿戴计算”的视频谈话TUP-Talk节目间隙接受了记者采访,谈到了自己在国内的创业项目。他表示,新公司格灵深瞳聚焦做计算机视觉(Computer Vision)和模式识别(Pattern Recognition),自己的创业项目主要做三维图像技术,基于新传感器和技术来做安全监控和人流行为的智能分析,并为商业决策提供数据驱动。他透露,通过在传感器和技术突破,他们可以将误报率从传统的30%~40%下降到1%以下。

基于新传感器和三维图像技术对人流行为智能分析 

目前,全世界卖出去的硬盘总容量里有70%左右都用来做安全监控了,但仍然没有搜索引擎能分析这些视频内容和人物行为,缺乏能去自动理解和分析视频(图像)内容的技术。而格灵深瞳所要做的事就是靠新传感新技术去充分理解和分析这些视频(图像)数据。到目前为止,科学家们尝试了多年但仍无法解决的很好的问题。

前Google Research研究员、格灵深瞳创始人赵勇 

赵勇举例, 通过格灵深瞳的技术用户可以在一个商场里精确分析消费者的行为(举例),也可以用来做更精准的安全监控。例如用到分析商场里顾客行为,他们看过哪些鞋子,比较过哪些品牌,最终购买了哪些鞋子等等行为,营销决策者通过这项技术分析视频数据和视图理解消费者心理曲线的变化,并制定相关的促销政策等等。

另外,全球最大的视频分享网站YouTube也会遇到这个问题,据统计,如今全球用户每秒钟上传的视频超过24小时,1天上传的视频内容相当于几个世纪。靠人工去筛选和审查自由上传的视频内容里是否有涉版权、黄色、暴力、反政府等是不现实的,如何靠技术去实现自动化的视频数据分析和处理,而格灵深瞳要做的事情就是如何把这个问题彻底解决掉。他强调,在这方面,他们有独特的方案和创新的技术。

尤其谈到的一点就是 新型传感器,只有用正确的传感器,才能采集到正确的数据,在正确的数据里做挖掘才是有意义的。赵勇认为,过去200年来人们企图依靠传统相机来做Computer Vision这件事的想法是完全错误的。传统的传感设备干不了这个事,因此对新传感设备的研究也是格灵深瞳的重要工作之一。

据悉,赵勇在美国11年,获得博士学位,之前曾在NVIDIA、三菱电器、爱普生、HP实验室都曾工作过,回国前在Google Research工作了三年。

创新是做比现在好10倍而不是好10%的产品
在谈到对创新的理解时,赵勇认为创新不是去做比现有的好10%,而是好10倍(的产品/技术)。如果只打算比现状好10%,意味着有大量的竞争者,而且会接受现有的产品和技术的限制。但如果把创新目标定义为比现在好10倍的时候,你就会发现没有竞争对手了。不仅仅因为这有趣,也因为这更容易了。

他坦言就目前观察,现在中国有很优秀的工程师,但创新环境比美国还差很多。他参加了很多VC和创业社团的活动,人们讨论的重点还是在 电子商务或者做一款移动 Apps。从某种程度上来说,这些都是在用技术的角度去做销售。甚至在融资见投资人的时候,他们会直接告诉创业者,在中国不要做技术创新,在中国做生意不要那么讲究诚信。 VC作为引导行业发展的风向标,如果连投资人都持创新无用的看法的话,那么这个社会的创新环境就不可能好。在这个体系下期望更多的开发者去做创新的事情也是一件难以想象的事。

国内不少创业者会说创新风险太大了,还是模仿或者山寨好了,创新的事让美国人去做吧。在赵勇看来,其实在美国创业的风险也很大,可能你做了20件创新的尝试,成功的只有一件。但是一旦成功,利润也是很大的。到现在变成只有美国人玩得起创新,他们可以砸很多钱进去,他们可以承担很大的风险。而且, 在美国并不是大家印象中的资金实力雄厚的大公司能对创新失败的容忍度更大,事实上,巨头们由于受制于上市公司股东利润的压力而相对“缩手缩脚”,大多数的创新是发生在中小型公司,例如Google的YouTube、Android、自动驾驶汽车等项目也是出自于收购的创新技术(产品)。

回国创业是因为更接近用户和机遇
在 谈到回国创业的原因时,赵勇认为其中一个重要原因能更接近用户。中国市场很大,走到消费者里面去,了解他们的需求,解决他们的问题,机会更大。另外,中国 有中国的痛苦,殊不知美国也有痛苦。而高速成长的中国和年轻群体创造了更多的机遇。他坦言回国后真实见到的中国和想象中的中国有差距,但作为乐观主义者, 可以预见的是中国也将从代工—山寨—创新,走到创新这个阶段。

最后,赵勇表示新的公司正在招技术人才。他们计划今年吸引10个左右技术伙伴,并做出产品模型。在人力资源方面,他们对两个方面尤其看重:首先是在计算机视觉和模式识别领域有一定背景的人;第二是对高性能运算比 较熟悉的人。另外,对SIMD、GPGPU、OpenGL、GLES、WebGL、CUDA和OpenCL等熟悉的人他们很欢迎。

特别提示:由前Google Research研究员、格灵深瞳创始人赵勇,百度云高级布道师张辉以及KnewOne的联合创始人李笑来就“可穿戴计算”主题共同参与的CSDN视频谈话节目TUP-Talk第一期即将发布,敬请期待。


"Conference on Computer Vision and Pattern Recognition"(计算机视觉与模式识别会议)是一个重要的学术会议,是计算机视觉和模式识别领域的顶级会议之一。该会议由国际计算机科学家和工程师组成的学术界和工业界的专家们参与,并定期举办。这个会议提供了一个促进学术交流、展示研究成果和讨论最新领域进展的平台。 在这个会议上,参与者可以提交他们的研究论文、技术报告和实验结果,以展示他们在计算机视觉和模式识别方面的最新研究进展。评审委员会将选择高质量的论文和报告,并安排它们在会议期间进行展示和讨论。会议包括主题演讲、研讨会、技术展示以及学术交流会等活动。 这个会议为与会者提供了让他们与同行专家和业界人士建立联系、讨论和分享他们的研究成果的机会。在这些交流中,与会者可以从其他研究者的研究中获取新的思路和灵感,同时也可以获得评论和建议来改进自己的工作。此外,会议还可能面向工业界,提供计算机视觉和模式识别领域的最新商业应用和发展趋势。 参加"Conference on Computer Vision and Pattern Recognition"对于从事计算机视觉和模式识别研究的学者和工程师来说,是一个重要的机会。通过参与这个会议,他们可以展示他们的研究成果,拓宽他们的学术视野,扩大他们的合作网络,并与领域内其他研究者共同推动计算机视觉和模式识别领域的发展。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值