5分钟速通 AI 计算机视觉发展应用

AI科技大本营

已于 2022-02-24 10:09:37 修改

阅读量2.4k

点赞数

文章标签：图像识别算法计算机视觉机器学习人工智能

于 2022-02-23 18:15:00 首次发布

本文链接：https://blog.csdn.net/dQCFKyQDXYm3F8rB0/article/details/123102242

版权

本文介绍了AI计算机视觉在物流、医疗、安防、农业、工业等多个领域的实际应用，涵盖了图像识别算法如深度学习、边缘学习和传统方法如SIFT/SURF，以及关键技术和标签如深度学习模型、特征融合和边缘检测。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

作者 | 李秋键

出品 | AI科技大本营（ID:rgznai100）

计算机视觉是进步最大、发展最快的领域之一。根据 Global VIEW 的研究，全球计算机视觉市场规模在 2020 的价值为 113 亿 2000 万美元，预计从2021 到 2028 的复合年增长率为 7.3% 。人工智能计算机视觉的使用案例几乎不计其数，其中最受欢迎的是无人机以及自动和半自动车辆。今天小编带大家几分钟速通 AI 计算机视觉发展应用。

应用前景

（1）物流：

利用计算机图像识别、地址库、合卷积神经网提升手写运单机器有效识别率和准确率，大幅度地减少人工输单的工作量和差错可能。

（2）肺部疾病影像诊断：

使用图像分割算法对肺部扫描序列进行处理，生成肺部区域图，然后根据肺部区域图生成肺部图像。利用肺部分割生成的肺部区域图像和结节标准信息生成结节区域图像，对基于CNN的肺结节分割器进行训练，然后对图像进行肺结节分割，得到疑似肺结节区域。找到疑似肺结节后，使用3D CNN对肺结节进行分类，得到真正肺结节的位置和置信度。

（3）垃圾桶智能监护：

首先，摄像头拍摄垃圾照片，并将照片上传至信息处理器，信息处理器对照片识别后，对垃圾进行分类；然后生成分类结果，再将结果发送到信号灯指示器；最后，对应的垃圾类别的信号灯就会亮起，提示人应该投入哪个投放口。需要注意的是，垃圾桶应配备传感器和感应开关，并且应当设置在垃圾桶外壳与投放口相对应的位置。显示屏最好选用触摸屏，便于用户操作和调整设置以及控制摄像头。

（4）交通：

（一）用于自适应信号控制机检测

1. 对车辆的检测

无论是针对全感应信号控制机还是半感应信号控制机，图像识别技术可以实时检测主干道或次干路车道上的车辆到达和排队情况，并可通过算法分析，对交叉口信号控制机进行实时数据更新，以保证最优算法，提供通畅的交通条件，在一定程度上避免了上下游交通拥堵。

2. 对行人的检测

在城市化建设的重要发展中，CBD商业步行街越来越彰显一个城市的文化精神之地，但大部分的商业街都是开放性的，如成都宽窄巷子等，这些旅游热点，往往是人潮拥挤，将其感应控制理念用于该交叉口的信号控制机，即采取车辆相位的最小绿灯时间和行人相位的最大绿灯时间，会大大提高行人和车辆的有效绿灯时间，并使得行人与车辆有序、畅通、安全地进行交通组织。而识别技术可以作为决策最小和最大绿灯时间的“发现者”；它可以在半感应控制系统中实时检测出车辆，并最大化地疏通行人；或在全感应控制系统中将两相行人流量和车辆流量反馈给信号控制机，从而优化交叉口的信号相位，达到确保行人、车辆的有序安全组织。

（二）用于潮汐车道的自适应检测

随着现代化都市工作节奏的加快，城市的交通流形成了周期性、潮汐性的现象；而潮汐车道应运而生，但面临波动的车流和交通区位的不同，为了保证潮汐车道的连续性，现有的潮汐车道都是稳定的时间点变化，即在规定时间内，该车道是上行还是下行方向，这样的设定时段式控制法，不具灵活性，由于早高峰和晚高峰具有不同集群的特点，因此忽略了交通的动态变化性这个特点。

根据大城市多具有放射环状式路网布局的特点，采用识别技术在城市中心多个射线沿路上的交叉口进行采集点布局，将上游路段实时反馈给下游，再结合电子屏实时信号控制，充分发挥潮汐车道的机动性，在时间上给予车流最大节省，从而缓解城市的拥堵，尤其是高峰期的拥堵。

（三）用于无人驾驶场景下的检测

随着人工智能的发展，无人驾驶在国内也得到了多个科研机构和大型企业的进一步探索，而试运车也在上海广州等地正式上路，这说明无人驾驶时代即将在不远的将来走进人们的生活，而面对如此复杂的交通环境，尤其是城市交通，要保证慢行交通尤其是步行者——人的安全，就要充分发挥无人驾驶各个传感器的综合优势，而摄像头作为其环境感知部分的重要部分之一，将深度学习和机器视觉同时融合，让无人车辆在上路前学会大量的城市场景储备，同时识别技术在无人驾驶车真正路用时发挥其作用，辅助车辆精准判别各类复杂的交通场景，并相应的给出决策行为。

（5）纺织品及服装：

纤维及织物组织识别

纺织阶段，图像识别技术可用于识别区分各类纤维及其织物，还可用于原棉加工前识别非棉杂质。对于织物组织结构，针织物中对纬编组织的研究较多，如对其编织周期的识别及组织结构的编码分类等。机织物中目前能够识别出织物中的三原组织；还可辅以亮度累加法检测分割经纬纱线、定位组织点，用于计算纱线密度和组织点的自动分类。但由于织物组织结构复杂多样，即使是人工识别，若非专业人士也难以轻易辨认，因此目前大多相关研究还停留在人工与计算机交互操作提取特征进行识别，难以大范围推广。

织物疵点检测

织物疵点检测经过十数年的发展，已基本能完成疵点判别、疵点分割、疵点分类等功能，并应用于工业。识别准度是其中较为重要的验收指标，但在保证准度的前提下，识别速度也需逐步提高，目前疵点在线监测的速度要求一般高于60 m/min，检测的疵点最小尺寸为0.5 mm。近年进展多为提高精细度及速度、扩展识别疵点类别及检验规范化等，还有部分学者在对织物褶皱及折痕的研究中也使用了图像识别相关技术，提出多视域织物外观平整度客观评级方法，尝试让机器判断织物平整度并验证，为织物表现性能的评估提供了有效的解决方案。

面料检索

面料图像的商业价值和大众使用率较高，消费者和生产商都有挑选符合自己预期面料的需求；且面料图像的颜色、纹理、形状等底层特征相对较为简单明晰，易于被计算机提取和区分。计算机除了能够通过对比面料图像实现相似面料的检索之外，还可基于对部分特征明显的面料进行感性属性定义，实现对面料的主观情感标注。如分析面料颜色的饱和度、对比度、色彩关系及纹理、图案等，人工将客观指标归纳至感性认知，用于面料检索和推荐。但目前的面料检索研究样本仍较为单一，多为同类面料不同色彩，或同类面料不同图案的研究，且人工定义情感属性局限较大，可尝试多维度多分类研究。

服装领域

服装领域中，对人体体型及服装款式图、样板图的识别多为服装院校和服装专业研究者完成；而计算机、信息技术领域等学者通常从识别服装实物图、着装图入手，对相关图像进行识别、检索、分割、分类及标注等。

人体体型识别

人体是服装的基础，服装的智能化生产离不开对个体体型的研究及描述。对人体体型的研究多基于来源于二维测量或三维人体扫描的数据，但就图像识别技术发展以来，也渐有学者致力于对图像信息的分析以识别体型。一般是对人体二维照片进行预处理后提取轮廓曲线，再用一定的描述方法对曲线分类、以达到对体型分类的目的。

服装款式图与样版图识别

关于服装款式图，可运用shock graph技术提取形状特征再对其分类；对于样版图，可对样版边缘进行识别，在样片文件中储存缝纫信息以用于自动缝纫技术。但服装行业中的款式图风格不一，还未形成一个统一规范作为分类标准；且shock graph一般用于进行形状外轮廓的识别与匹配，不包括内部细节，无法作为样版库的检索依据。需求方面，对服装款式图与样版图的识别需求较小；识别难度方面，服装款式图和样版图像只包含黑白二色及线条，无颜色和纹理特征，就发展现状而言识别难度较实物图高，需要对比不同的图像识别模型和方法，综合选择最合适的方案

服装着装图检索分类

服装图像识别可分为对服装廓形、尺寸的识别，及服装分类、检索和标注。服装廓形的识别中，一般先在人体着装照片以人脸或人体肤色为参照来确定照片中的服装，再对服装扫描识别特征点、获取数据，由人体身高比例或其他公式自动计算测量服装廓形相关尺寸，以此定义照片中的服装廓形。借助计算机可实现部分服装实物图的尺寸及尺码测量，但仍有较多人机交互工作量。

（6）安防领域的实践应用：

安防是每个行业都比较重视的问题之一。安防领域，计算机图像识别技术应用广泛，比如当前很多城区和街道都安装了监控，主要目的是发生事故时，可以准确查找相关资料和图像，为事故判定提供有效依据。现如今，我国大多数地区都已完成了自动化视频监控，这是图像识别技术处理应用实践的一个方式。将识别技术与安防结合，可以最大限度减轻人工劳动力，提升工作时效性，为事故纠纷提供有效依据。

（7）农业领域的实践应用：

我国是一个农业大国。近年来，我国在农业中时常引进现代技术，培养农业植物实验和新品种种植试验都融合了现代图像识别技术，以此观察植物的生长情况，从而确定影响植物生长的因素。此外，图像识别技术可鉴定农产品最终质量，为农业发展提供相关依据和指导。

（8）工业领域：

工业领域，图像识别处理技术有非常多应用。它大大提升了工作时效性，比如自动装配中的质量检测、流体力学的阻力分析、自动分拣、识别排列状态以及设计、制造视觉效果等。其中，值得一提的是研究具备感官功能的机器人，给工业生产奠定了基础。

（9）航空领域：

计算机图像识别处理技术在航空领域的应用，除了处理月球表面和火星图片外，还有遥感技术等。经过空中图像处理，如将数字化数据转为相应信号并存入内存，当卫星经过地面上空时，高速传送图片，由处理中心解析。这些图像无论是储存、传输还是成像判读，都必须采用数字图像识别技术。现如今，世界各个大国都使用卫星获取所需图像资源，例如灾难检测、地质勘探、农城规划等。数字图像识别处理技术在天象预报和其他星球研究中发挥了重要作用。

（10）通信领域：

现如今，通信行业的主要发展目标是融合声音、文字的通信。其中，图像通信是最复杂的技术领域。图像数据量较大、较广，目前智能电视机信号传输必须达到100 M/s以上，想要把输送高速数据，必须使用编码技术压缩信息量。

（11）军事领域：

军事行业，图像识别处理技术主要分布在导弹、照片解读、具备图像传输的自动化军事系统等。目前，公安系统融入了图像识别技术，主要应用于人脸识别、图片复原等方面，例如常见的高速公路不停车收费技术是图像识别技术的应用成果。

图像识别算法

（1）基于度量学习核函数的图像识别算法：

通过马氏度量学习对光学足迹图像训练样本特征进行学习得到最优的度量矩阵，从而构造度量学习核函数，在该核函数下再使用SVM进行分类识别．

（2）基于单步目标识别架构的轻量级裂纹图像自动识别：

单步识别算法，相比于两步式识别算法主要优点在于能够提高检出速度与降低对硬件使用的负载，通过合理地网络设计能够提高结构视觉检测工作的效率与质量，最终实现其自动化。SSD算法包括以下组成部分：用于特征提取的Deep CNN（也称为基础网络，即Basenet）、特征层集合（Feature Layers）、识别分类器（Classifier）、非极大值抑制（Non-Maximum Suppression，NMS）。

（3）改进Mask R-CNN的火焰图像识别算法：

基于改进Mask R-CNN的火焰图像识别算法，算法在Mask R-CNN的基础上，在特征金字塔引入一条自下向上的特征融合，同时改进了损失函数，使边框定位更准确。

（4）基于RGB颜色空间：

根据机场跑道路面上鲜明的颜色特征，采用抗噪性能好、识别速度快、识别精度高的RGB颜色空间识别方法进行黑色胶痕的识别。

（5）基于稀疏表示和多特征融合的 SAR 图像识别：

当采用稀疏表示进行 SAR 图像目标识别时，可采用的特征包括灰度特征、局部特征(HOG 特征)及基于信号变换提取的特征(单演信号特征)等。进行多特征融合时，主要采用基于联合稀疏表示的识别方法

（7）基于边缘学习的低分辨率图像识别算法：

提出了一种基于GAN结构的边缘学习低分辨率图像识别算法，将通过生成网络学习到的低分辨率图像的幻想边缘信息融入到识别网络中，得到清晰的特征图纹理轮廓，从而丰富了低分辨率图像的高频信息

（8）基于方向梯度直方图和灰度共生矩阵混合特征的金文图像识别：

用HOG提取金文的全局结构特征，用GLCM提取金文的局部纹理特征，并将两者进行融合，对金文的特征描述更为全面。最后选取支持向量机（SVM）分类器对金文图像进行分类识别

（9）基于WGAN的图像识别方法：

在GAN的生成器和判别器中加入了相同的类别标签，指导样本的生成，使GAN具有了生成多类数据的能力。

（10）传统算法：

机器学习算法K最邻近(K-NearestNeighbor, KNN)，支持向量机(Support Vector Machine, SVM)和多层感知机(MultilayerPerceptron，MLP)等，以及近几年比较热门的基于深度学习和卷积神经网络(Convolutional neural network, CNN)的图像识别算法。

深度学习模型包括深度信念网络(Deep Belief Network, DBN)、卷积神经网络(CNN)、循环神经网络(Recurrent Neural Networks，RNN)等。这些模型通过构建一个更深层次的网络，在此基础上由计算机学习得到图像更深层次的特征信息以及数据隐含的内部关系，使学习到的特征更具有表达能力，从而分类更加准确。

基于特征匹配的，比如 ORB、SIFT+SURF等等。