从试用到使用:计算机视觉产业新一轮发展的起步年

从试用到使用:计算机视觉产业新一轮发展的起步年

 

https://mp.weixin.qq.com/s?__biz=MzI0ODcxODk5OA==&mid=2247498370&idx=2&sn=a3cf59324678183e9625a6555355249d&scene=21#wechat_redirect

 

视觉是最重要的感官之一,我们通过眼睛看到大千世界,通过大脑分析看懂场景,并能回忆过往的视觉记忆。计算机视觉,就是利用电子、信息、计算机等技术,采用电子成像系统作为基础的感知单元采集视频图像,并通过信息化技术,分析并解释采集到的视频图像。计算机视觉从学术上分类,包括图像处理、模式与图像识别、事件分析、场景理解等众多图像相关的技术学科,以及计算机、信号处理、物理学、数学、生物学等多个基础学科,且随着人工智能技术的演进还在不断发展。

 

利用计算机视觉,我们最终期望通过技术的发展,计算机能和人一样通过视觉观察和理解世界,并且能够具备自主适应和认知环境的能力。

 

计算机视觉技术百花齐放,加速多个产业升级

 

深度学习是当前人工智能领域最为热点的技术之一,其发展非常迅猛,通过深度学习技术,可以在短时间内达到传统模式识别技术的性能。深度学习技术源于 80 年代的神经网络技术,最近两年的发展才真正实现大规模商业化落地,背后驱动这项人工智能技术的突飞猛进源于芯片技术发展带来的计算能力指数级提升,互联网和物联网技术发展提供了海量的数据,深度学习技术开源推动算法的快速工程化与迭代升级。

 

2018 年是深度学习为代表的计算机视觉技术百花齐放的元年,创业公司和成熟企业在人工智能的浪潮里相互竞争,加速多个产业的升级。在算法层面,众多创业公司推出了很多高性能的人工智能算法,成熟的行业领导企业也迅速完成了技术突破和解决方案升级;在芯片层面,创业公司和巨头企业也发布了各类神经网络的 IP 和芯片,形成 GPU、DSP、xNN、FPGA 各自发力的格局,满足边缘计算、中心计算和云计算的计算力需求。从计算机视觉应用的产业板块上分析,以视频应用为基础的视频安防、工业视觉是目前最快落地的行业,医疗、智能驾驶领域的技术正在快速发展中,未来技术突破将会产生巨大的商业应用价值。

 

人工智能技术和计算能力的突破势必带来产品和解决方案的全面升级,从而加速客户应用的规模化效应。我们现在在交通道路上可以看到非常多的摄像机拍摄路面的情况,这些基本都具备人工智能能力,能够对道路上车辆的行驶情况分析,比如判断是否违章。

 

以前要使用智能化分析交通行为,摄像机要连接到工控服务器,在服务器里部署视频处理的算法实现智能分析。直到 2007 年,以大华股份为代表的企业通过技术创新,推出了业内一体化智能交通摄像机,把当时高性能的 DSP 嵌入到摄像机,利用一台摄像机实现了交通违章和车牌识别功能,从而加速行业的快速升级和新型产品的普及。现在随着深度学习技术的引入以及芯片计算能力的革命性提升,一台交通摄像机可以处理几十种的违章行为,而且还能进一步分析行人、非机动车的行为,实现对视频的全结构化解析,这又是一次里程碑式的发展。

 

同样以人脸识别技术的应用为例,2017 年人脸识别技术取得关键性突破,大规模的人脸识别率达到 90% 以上,引发商业和产品化的快速落地。现在我们可以使用刷脸支付、刷脸开门、刷脸考勤等便捷的服务,我们同样可以采用这项人工智能技术实现商业的分析和数据服务。另一方面,随着产品计算能力的大幅提升,新型人工智能的一体化产品取代了传统解决方案里需要部署的一套复杂的系统。

 

尽管计算机视觉在深度学习技术推动下取得惊人的成果,但我们也需要清醒的看到人工智能技术还存在很多瓶颈。当前的人工智能还不够真正的智能,离机器自主认知还有很长的路要走,现有技术还只能做到高效地解决单一或特定的任务。此外深度学习算法是个黑盒子,网络内部各层的解释性差,在实际工程过中存在不可预见性,尤其是算法还无法达到普适性要求,复杂性和融合性应用带来很多误差和相互干扰。

 

由于深度学习技术采用的是大规模数据驱动,大规模的数据训练本身对超算中心的能力是很大的挑战,同时在实际工程化应用中场景非常复杂多变,这会出现很多无法预测的干扰数据,导致很容易计算出未知的异常结果。更为重要的是虽然人工智能已经有了非常高的性能指标,但客户对人工智能应用的期望却往往超越现有的算法表现结果,这也需要计算机视觉技术持续突破来解决的实际问题。


 

视频安防和工业视觉领域应用发展最快

 

2018 年计算机视觉技术在视频安防和工业视觉领域应用是发展最快的两个领域,尤其在视频安防领域,也是业内公认最适合落地的行业。安防应用的摄像机每天产生超 3000PB 的数据,这些数据里 99% 的数据都是无效的,而依靠人工智能技术可以快速对视频数据进行结构化分析,可以挖掘出其中的价值数据,进一步结合大数据技术将数据进行时空碰撞,从而实现数据关联和数据检索应用。

 

计算机视觉作为物联网的视觉感知和视觉认知的重要环节,除了视频安防的智慧城市和智能交通的应用外,已广泛应用于在智慧金融、智慧楼宇、智慧教育、智慧环保、智慧城管等各个采用视频应用的行业,即使是传统的视频安防行业应用也已经从安全管理延伸到城市管理、绿色出行等新型应用。

 

以视频结构化技术的应用为例,这是一种基于视频内容进行信息提取的技术。视频结构化解析技术实现了人、机动车、非机动车和行为的解析,其中人的基本特征包括面部、性别、年龄、身高、发饰、衣着、帽子、包、口罩、伞等;机动车的基本特征包括车牌、车标、颜色、车型车系、车贴、驾驶座人员、车饰、车窗等;非机动车的特征包括车型、颜色、非机动车牌、乘车人等;行为的基本特征包括绊线入侵、穿越围栏、区域入侵、徘徊检测、物品遗留、物品搬移、快速奔跑、打架斗殴、人员聚集等。

 

道路拥堵治理也是当前城市道路管理的痛点之一,人工智能技术可以发挥巨大的价值,在管理区域内的每个摄像机可以识别出视频中的人、车的行为,即时分析违章,还能获取到道路实时通行的人流、车流、密度等数据,依靠大量摄像机数据联动,结合红绿灯管理系统,对道路车辆通行按需管理并进行分流提醒,可以达到有效提升道路通行平均速度的目的。

 

同样在生产制造过程中,质检环节需要大量工人靠人眼去评判生产零件、整机的质量。现在计算机视觉高速发展,可以通过摄像机安装在流水线上,高帧率拍摄视频图像并实时分析零部件的表面各种工艺缺陷,例如液晶屏的划伤、裂纹,金属零件的完整性,整件安装的角度一致性等,同时还可以直接扫码,实现生产过程自动化录入。因此在工业视觉领域,随着人工智能的能力快速适配,机器开始逐步取代人工,再极大程度上降低生产成本的同时还提升了产品质量。

 

此外,现在在人脸识别、文字识别、物品识别、行为识别、肢体识别等各个领域都有非常丰富的应用出现,人工智能已经融入到人们的生活、出行等各个方面,比如刷脸支付、拍摄翻译、动植物分类识别、体感游戏等等。可见,视觉技术的升级和应用的拓展,将带来相关产业升级和用户体验创新。

 

计算机视觉产业新一轮发展的起步年

 

2017 年计算机视觉产业处于井喷期,众多的创业公司、巨头企业以及跨界公司参与到了这个产业里,各类的新技术和新应用出现在视野内。2018 年更多的是技术到产业的落地,成熟达到商用的视觉技术结合市场的需求在行业中持续开拓市场,尚在演进中的技术正在探索挖掘试点应用,一些伪智能的技术则被快速淘汰,同时学术界和工业界也在创新地研究新的技术点并寻求突破。

 

2018 年是计算机视觉产业新一轮发展的起步年,市场才刚刚启动,经历过去两年市场和用户认知的培养,当前业务应用开始逐步从试用走向使用,在这个过程中技术也得到持续发展,解决了试用过程中碰到的种种问题。

 

随着市场需求的打开,在芯片、算法、应用各个层面有了更多的企业参与。从个别的算力平台到多元化计算芯片的格局,从早期少数算法公司技术创新到当前众多成熟公司共同参与,从算法单点爆发吸引眼球到现在人工智能推动产业升级与应用融合,目前市场格局已经发生重大的转变,走向了从技术驱动型转换到应用驱动型的发展。

 

计算机视觉的市场规模非常巨大,这是一种推动各个产业升级的力量,我们无法单纯衡量它的市场价值。可以预见,占据应用市场以及技术领先型的公司将在未来人工智能浪潮中获取核心价值,并引领行业的发展。


 

未来 2-3 年发展趋势

 

展望未来 2-3 年,计算机视觉领域在技术、应用、产业各个层面必然会有新的突破。在算法方面,深度学习技术会继续发展,但可能会有新的技术方法诞生引发新的变革。芯片方面,市场上会有更多高性能低功耗的神经网络 SoC 芯片发布,同时部分固化的视觉算法会内嵌集成到芯片里。

 

应用方面未来应该会持续蓬勃发展,这对于企业和用户而言都是非常巨大的市场和想象空间:

 

  • 首先在现有的基础上,会更贴近用户的实际使用需求,算法的迭代升级也会快速提升用户体验;
  • 其次新算法的推出也会带来更多的应用场景和业务需求;
  • 最后,应用的拓展将推动产业的发展,随着新一代产品和解决方案的发布和普及,更多融合型、跨界型的业务模式会产生。

 

当下人工智能、物联网、云与大数据、5G、云计算等主导未来的核心技术正在加速发展与演进,计算机视觉行业生态在这些技术力量的驱动下,必将形成新的技术和市场格局。

【完】

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
波动方程成像方法及其计算,张文生编写,目录好像少了一页,正文没有问题,关于波动方程成像方法。目录如下,请根据需要下载~~~(*^__^*) 目录编辑 前言 第1章 Kirchhoff偏移 1.1 偏移成像概述 1.2 Kirchhoff积分公式 1.3 Kirchhoff偏移公式 1.4 Green函数和Hankel函数 1.5 Kirchhoff偏移公式的离散形式 1.6 单程波形式的Kirchhoff公式 1.7 程函方程和输运方程 1.8 射线Kirchhoff公式 1.9 散射Kirchhoff成像 第2章 零偏移距记录合成 2.1 伪谱法合成零偏移距记录 2.1.1 方法原理 2.1.2 数值计算 2.2 混合法合成零偏移距记录 2.2.1 理论方法 2.2.2 数值计算 2.3 三维正交各向异性介质有限差分正演模拟 2.3.1 各向异性方程及其差分方程的建立 2.3.2 三分量波场通量校正的实现 2.3.3 三维各向异性吸收边界条件 2.3.4 稳定性条件 2.3.5 数值计算 第3章 复杂构造叠后深度成像 3.1 逆时深度偏移 3.1.1 方法原理 3.1.2 稳定性条件 3.1.3 数值计算 3.2 四种常用的非Kirchhoff偏移方法 3.2.1 相移加插值(PSPI)法 3.2.2 隐式(ω-x)域有限差分(FD)法 3.2.3 裂步傅里叶(SSF)法 3.2.4 傅里叶有限差分(FFD)法 3.2.5 数值计算 3.2.6 计算量概述 3.3 混合法深度偏移及其吸收边界条件 3.3.1 理论方法 3.3.2 吸收边界条件 3.3.3 数值计算 第4章 复杂构造叠前深度成像 4.1 炮集叠前深度偏移及其并行实现 4.1.1 理论方法 4.1.2 成像计算 4.2 双平方根算子叠前深度偏移 4.2.1 双平方根算子 4.2.2 双平方根算子波场外推 4.2.3 成像计算 4.3 裂步Hartley变换叠前深度偏移 4.3.1 理论方法 4.3.2 成像计算 4.4 相位编码叠前深度偏移 4.4.1 交叉成像的产生 4.4.2 相位编码的特性 4.4.3 成像计算 4.5 平面波波场合成叠前深度偏移及其并行实现 4.5.1 波场合成偏移方法 4.5.2 控制照明技术 4.5.3 成像计算 第5章 三维多方向分裂隐式波场外推 5.1 交替方向隐格式 5.1.1 旁轴近似 5.1.2 吸收边界条件 5.2 三维频率空间域多方向分裂 5.2.1 高阶近似与分裂方向数目的选择 5.2.2 近似系数的确定 5.2.3 二、三、四、六、八方向上的算子分裂 5.3 由Kirchhoff积分解导出偏移公式 5.4 混合法四方向分裂偏移 5.4.1 混合法四方向分裂 5.4.2 分裂误差 5.4.3 螺旋线上的四方向波场外推 5.4.4 数值计算 第6章 正多边形网格上Laplace算子的差分表示 6.1 导数的中心差分算子表示 6.2 正多边形网格上的Laplace算子的差分表示 6.3 广义勾股定理 6.4 正方形和正六边形上的差分格式 6.4.1 长算子 6.4.2 紧凑算子 6.4.3 在波场外推中的应用 第7章 三维频率空间域显式波场外推 7.1 稳定的显式外推格式 7.2 McClellan滤波器 7.3 旋转的McClellan滤波器 7.3.1 45°旋转9点和17点滤波器 7.3.2 平均滤波器 7.4 六边形网格上的三维地震数据 7.4.1 一维采样理论 7.4.2 三维地震数据的带限表示 7.4.3 六边形网格上的数据采样 第8章 三维复杂构造叠前深度成像 8.1 全波波动方程的分解 8.2 混合法炮集三维叠前深度偏移 8.2.1 混合法波场外推 8.2.2 相对误差分析 8.2.3 成像计算与并行实现 8.3 混合法三维平面波合成叠前深度偏移 8.3.1 三维平面波合成与目标照明 8.3.2 因子分解波场外推 8.3.3 成像计算 8.4 共方位数据三维叠前偏移 8.4.1 共方位数据的下延拓 8.4.2 稳相路径的射线参数等价表示 8.4.3 共方位下延拓的精度 8.4.4 共方位Stolt偏移 参考文献 索引

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值