从试用到使用：计算机视觉产业新一轮发展的起步年

最新推荐文章于 2024-04-06 00:01:50 发布

喜欢打酱油的老鸟

最新推荐文章于 2024-04-06 00:01:50 发布

阅读量455

点赞数

文章标签：计算机视觉

人工智能专栏收录该内容

4214 篇文章 345 订阅

订阅专栏

从试用到使用：计算机视觉产业新一轮发展的起步年

https://mp.weixin.qq.com/s?__biz=MzI0ODcxODk5OA==&mid=2247498370&idx=2&sn=a3cf59324678183e9625a6555355249d&scene=21#wechat_redirect

视觉是最重要的感官之一，我们通过眼睛看到大千世界，通过大脑分析看懂场景，并能回忆过往的视觉记忆。计算机视觉，就是利用电子、信息、计算机等技术，采用电子成像系统作为基础的感知单元采集视频图像，并通过信息化技术，分析并解释采集到的视频图像。计算机视觉从学术上分类，包括图像处理、模式与图像识别、事件分析、场景理解等众多图像相关的技术学科，以及计算机、信号处理、物理学、数学、生物学等多个基础学科，且随着人工智能技术的演进还在不断发展。

利用计算机视觉，我们最终期望通过技术的发展，计算机能和人一样通过视觉观察和理解世界，并且能够具备自主适应和认知环境的能力。

▌计算机视觉技术百花齐放，加速多个产业升级

深度学习是当前人工智能领域最为热点的技术之一，其发展非常迅猛，通过深度学习技术，可以在短时间内达到传统模式识别技术的性能。深度学习技术源于 80 年代的神经网络技术，最近两年的发展才真正实现大规模商业化落地，背后驱动这项人工智能技术的突飞猛进源于芯片技术发展带来的计算能力指数级提升，互联网和物联网技术发展提供了海量的数据，深度学习技术开源推动算法的快速工程化与迭代升级。

2018 年是深度学习为代表的计算机视觉技术百花齐放的元年，创业公司和成熟企业在人工智能的浪潮里相互竞争，加速多个产业的升级。在算法层面，众多创业公司推出了很多高性能的人工智能算法，成熟的行业领导企业也迅速完成了技术突破和解决方案升级；在芯片层面，创业公司和巨头企业也发布了各类神经网络的 IP 和芯片，形成 GPU、DSP、xNN、FPGA 各自发力的格局，满足边缘计算、中心计算和云计算的计算力需求。从计算机视觉应用的产业板块上分析，以视频应用为基础的视频安防、工业视觉是目前最快落地的行业，医疗、智能驾驶领域的技术正在快速发展中，未来技术突破将会产生巨大的商业应用价值。

人工智能技术和计算能力的突破势必带来产品和解决方案的全面升级，从而加速客户应用的规模化效应。我们现在在交通道路上可以看到非常多的摄像机拍摄路面的情况，这些基本都具备人工智能能力，能够对道路上车辆的行驶情况分析，比如判断是否违章。

以前要使用智能化分析交通行为，摄像机要连接到工控服务器，在服务器里部署视频处理的算法实现智能分析。直到 2007 年，以大华股份为代表的企业通过技术创新，推出了业内一体化智能交通摄像机，把当时高性能的 DSP 嵌入到摄像机，利用一台摄像机实现了交通违章和车牌识别功能，从而加速行业的快速升级和新型产品的普及。现在随着深度学习技术的引入以及芯片计算能力的革命性提升，一台交通摄像机可以处理几十种的违章行为，而且还能进一步分析行人、非机动车的行为，实现对视频的全结构化解析，这又是一次里程碑式的发展。

同样以人脸识别技术的应用为例，2017 年人脸识别技术取得关键性突破，大规模的人脸识别率达到 90% 以上，引发商业和产品化的快速落地。现在我们可以使用刷脸支付、刷脸开门、刷脸考勤等便捷的服务，我们同样可以采用这项人工智能技术实现商业的分析和数据服务。另一方面，随着产品计算能力的大幅提升，新型人工智能的一体化产品取代了传统解决方案里需要部署的一套复杂的系统。

尽管计算机视觉在深度学习技术推动下取得惊人的成果，但我们也需要清醒的看到人工智能技术还存在很多瓶颈。当前的人工智能还不够真正的智能，离机器自主认知还有很长的路要走，现有技术还只能做到高效地解决单一或特定的任务。此外深度学习算法是个黑盒子，网络内部各层的解释性差，在实际工程过中存在不可预见性，尤其是算法还无法达到普适性要求，复杂性和融合性应用带来很多误差和相互干扰。

由于深度学习技术采用的是大规模数据驱动，大规模的数据训练本身对超算中心的能力是很大的挑战，同时在实际工程化应用中场景非常复杂多变，这会出现很多无法预测的干扰数据，导致很容易计算出未知的异常结果。更为重要的是虽然人工智能已经有了非常高的性能指标，但客户对人工智能应用的期望却往往超越现有的算法表现结果，这也需要计算机视觉技术持续突破来解决的实际问题。

▌视频安防和工业视觉领域应用发展最快

2018 年计算机视觉技术在视频安防和工业视觉领域应用是发展最快的两个领域，尤其在视频安防领域，也是业内公认最适合落地的行业。安防应用的摄像机每天产生超 3000PB 的数据，这些数据里 99% 的数据都是无效的，而依靠人工智能技术可以快速对视频数据进行结构化分析，可以挖掘出其中的价值数据，进一步结合大数据技术将数据进行时空碰撞，从而实现数据关联和数据检索应用。

计算机视觉作为物联网的视觉感知和视觉认知的重要环节，除了视频安防的智慧城市和智能交通的应用外，已广泛应用于在智慧金融、智慧楼宇、智慧教育、智慧环保、智慧城管等各个采用视频应用的行业，即使是传统的视频安防行业应用也已经从安全管理延伸到城市管理、绿色出行等新型应用。

以视频结构化技术的应用为例，这是一种基于视频内容进行信息提取的技术。视频结构化解析技术实现了人、机动车、非机动车和行为的解析，其中人的基本特征包括面部、性别、年龄、身高、发饰、衣着、帽子、包、口罩、伞等；机动车的基本特征包括车牌、车标、颜色、车型车系、车贴、驾驶座人员、车饰、车窗等；非机动车的特征包括车型、颜色、非机动车牌、乘车人等；行为的基本特征包括绊线入侵、穿越围栏、区域入侵、徘徊检测、物品遗留、物品搬移、快速奔跑、打架斗殴、人员聚集等。

道路拥堵治理也是当前城市道路管理的痛点之一，人工智能技术可以发挥巨大的价值，在管理区域内的每个摄像机可以识别出视频中的人、车的行为，即时分析违章，还能获取到道路实时通行的人流、车流、密度等数据，依靠大量摄像机数据联动，结合红绿灯管理系统，对道路车辆通行按需管理并进行分流提醒，可以达到有效提升道路通行平均速度的目的。

同样在生产制造过程中，质检环节需要大量工人靠人眼去评判生产零件、整机的质量。现在计算机视觉高速发展，可以通过摄像机安装在流水线上，高帧率拍摄视频图像并实时分析零部件的表面各种工艺缺陷，例如液晶屏的划伤、裂纹，金属零件的完整性，整件安装的角度一致性等，同时还可以直接扫码，实现生产过程自动化录入。因此在工业视觉领域，随着人工智能的能力快速适配，机器开始逐步取代人工，再极大程度上降低生产成本的同时还提升了产品质量。

此外，现在在人脸识别、文字识别、物品识别、行为识别、肢体识别等各个领域都有非常丰富的应用出现，人工智能已经融入到人们的生活、出行等各个方面，比如刷脸支付、拍摄翻译、动植物分类识别、体感游戏等等。可见，视觉技术的升级和应用的拓展，将带来相关产业升级和用户体验创新。

▌计算机视觉产业新一轮发展的起步年

2017 年计算机视觉产业处于井喷期，众多的创业公司、巨头企业以及跨界公司参与到了这个产业里，各类的新技术和新应用出现在视野内。2018 年更多的是技术到产业的落地，成熟达到商用的视觉技术结合市场的需求在行业中持续开拓市场，尚在演进中的技术正在探索挖掘试点应用，一些伪智能的技术则被快速淘汰，同时学术界和工业界也在创新地研究新的技术点并寻求突破。

2018 年是计算机视觉产业新一轮发展的起步年，市场才刚刚启动，经历过去两年市场和用户认知的培养，当前业务应用开始逐步从试用走向使用，在这个过程中技术也得到持续发展，解决了试用过程中碰到的种种问题。

随着市场需求的打开，在芯片、算法、应用各个层面有了更多的企业参与。从个别的算力平台到多元化计算芯片的格局，从早期少数算法公司技术创新到当前众多成熟公司共同参与，从算法单点爆发吸引眼球到现在人工智能推动产业升级与应用融合，目前市场格局已经发生重大的转变，走向了从技术驱动型转换到应用驱动型的发展。

计算机视觉的市场规模非常巨大，这是一种推动各个产业升级的力量，我们无法单纯衡量它的市场价值。可以预见，占据应用市场以及技术领先型的公司将在未来人工智能浪潮中获取核心价值，并引领行业的发展。

▌未来 2-3 年发展趋势

展望未来 2-3 年，计算机视觉领域在技术、应用、产业各个层面必然会有新的突破。在算法方面，深度学习技术会继续发展，但可能会有新的技术方法诞生引发新的变革。芯片方面，市场上会有更多高性能低功耗的神经网络 SoC 芯片发布，同时部分固化的视觉算法会内嵌集成到芯片里。

应用方面未来应该会持续蓬勃发展，这对于企业和用户而言都是非常巨大的市场和想象空间：

首先在现有的基础上，会更贴近用户的实际使用需求，算法的迭代升级也会快速提升用户体验；
其次新算法的推出也会带来更多的应用场景和业务需求；
最后，应用的拓展将推动产业的发展，随着新一代产品和解决方案的发布和普及，更多融合型、跨界型的业务模式会产生。

当下人工智能、物联网、云与大数据、5G、云计算等主导未来的核心技术正在加速发展与演进，计算机视觉行业生态在这些技术力量的驱动下，必将形成新的技术和市场格局。

【完】

喜欢打酱油的老鸟

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
从试用到使用：计算机视觉产业新一轮发展的起步年

从试用到使用：计算机视觉产业新一轮发展的起步年 https://mp.weixin.qq.com/s?__biz=MzI0ODcxODk5OA==&amp;mid=2247498370&amp;idx=2&amp;sn=a3cf59324678183e9625a6555355249d&amp;scene=21#wechat_redirect 视觉是最重要的感官之一，我们通过眼睛看到...
复制链接

扫一扫