机器视觉的发展、应用与案例分析

机器视觉的发展历程

机器视觉是人工智能领域的一个分支,其目标是使机器能够模拟和理解人类视觉系统的功能。机器视觉的发展历史可以追溯到几十年前,经历了多个阶段的演进。

  1. 早期阶段(20世纪50年代-60年代):
    1956年,Rosenblatt提出了感知机模型,尝试模拟人脑神经元的结构和功能,这是机器学习和神经网络的早期尝试。
  2. 基于特征的方法(20世纪60年代-80年代):
    1960年代末,出现了基于特征的方法,如边缘检测、角点检测等。这一时期主要关注于图像的低级特征提取。
    1970年代,David Marr提出了“计算视觉”理论,强调从图像中提取不同层次的特征以实现物体识别。
  3. 知识推理方法(20世纪70年代-80年代):
    1980年代初,机器视觉的研究逐渐转向知识推理。系统试图使用先前编程的规则和知识来理解和解释图像。
  4. 统计学习方法(20世纪80年代-90年代):
    1980年代末和1990年代初,统计学习方法开始引入机器视觉。支持向量机、随机森林等方法逐渐应用于目标检测和分类。
  5. 深度学习时代(21世纪初至今):
    2012年,AlexNet在ImageNet竞赛上获得胜利,标志着深度学习在机器视觉中的崛起。深度学习的卷积神经网络(CNN)取得了在图像分类、目标检测和语义分割等任务上的巨大成功。
    2014年,GoogLeNet和VGG等模型的出现进一步推动了深度学习在机器视觉领域的发展。
    2017年,Transformer模型在自然语言处理领域的成功,目前也在计算机视觉领域得到逐步推广与广泛使用。

机器视觉系统

机器视觉系统通常使用人眼的光学系统来类比,人眼的光学系统由角膜、玻璃体、晶状体、瞳孔等构成。视网膜将光学图像转换成神经电信号在人脑形成画面。视锥细胞主要用于感受颜色,视杆细胞主要用于感受亮度。

机器视觉是通过光学的装置和非接触的传感器,自动地接收和处理一个真实物体的图像,以获得所需信息或用于控制机器人运动的装置。机器视觉即用机器代替人眼,模拟眼睛进行图像采集,经过图像识别和处理提取信息,最终通过执行装置完成操作。相比于人类视觉,机器视觉技术具有精确性、可靠性高、环境适应性好、可持续工作、生产效率高等优势,在现代工业生产、智能制造、医药、食品包装等领域都发挥着较大的作用。

机器视觉系统主要包硬件系统和软件系统。其中,硬件系统包括(工业)相机、光源、镜头、光学器件、处理器(CPU)与图像存储及显示设备等。软件系统包括图像处理算法、用户界面(GUI)等。下面简单介绍几个核心设备。

相机

相机的作用: 将通过镜头的光信号转换为电信号。

相机的分类:
按芯片技术:CCD相机、CMOS相机
按靶面类型:面阵相机、线阵相机
按输出模式:模拟相机、数字相机
按颜色:彩色相机、黑白相机
按是否带处理器:智能相机、非智能相机

相机主要特性参数:
芯片类型:CCD、CMOS
分辨率:位于CCD&CMOS芯片上的像素数
速度:line/s、fps
光学接口:C,CS,F等
电气接口:USB、IEEE 1394、GigE

光源

光源的作用: 照亮目标,突出感兴趣的特征,机器视觉从获取一张好的图片开始,光源至关重要。

光源的分类:
按照明部件:普通照明灯、LED灯、激光
按照射方式:前向光、背向光、结构光、频闪照明
按照明方式:平面照明、环形光源、同轴光源、平行光源、电光源、低角度光源、线光源、光栅
按光源波长:白光、单色光、近可见光、X-ray

光源光路技术: 补光、滤光、反射、分光、漫射

镜头

镜头的作用: 实现光束变换、将目标成像在图像传感器的光敏面上,类似于针孔成像的针孔和人眼晶状体的作用。

镜头分类:
按等效焦距:广角镜头、中焦距镜头、长焦距镜头
按功能:变焦距镜头、定焦距镜头、定光圈镜头
特殊镜头:微距镜头、显微镜头、远心镜头、红外线镜头、紫外线镜头

镜头基本参数: 视野(FOV)、景深(DOV)、工作距离(WD)

机器视觉应用

相机作为机器视觉的最核心的传感器设备,已广泛应用于安防、智能制造、汽车、手机等领域,单一相机所涉及到的视觉技术:

  • 全景联动技术:全景对感兴趣的目标检测分析,控制长焦的球机进行联动抓拍获得局部高清图像。
  • 目标自适应快门:根据环境亮度为目标自适应选择合适的快门时间。
  • 场景图像自适应:对场景进行识别根据其类型自动调整色彩配置。
  • AI-ISP降噪:利用深度学习实现图片降噪。
  • 图像识别、检测与跟踪、图像分割、三维重建、SLAM(即时定位与建图)等

随着机器视觉的发展,单一相机往往获取环境的信息是有限的,为了处理一些复杂的任务,我们常常需要多维感知,多传感器融合的方法。例如雷视融合(获取速度)、热成像可见光融合(获取温度)、偏振成像(获取应力)、短波红外(看穿浓雾)、高光谱(辨认元素)、X光(透视物体)等等。将这种组合的方法转化为产品进行落地,往往能够解决一些仅依靠相机难以解决的棘手问题。

案例分析

产品质量检测

现状与难点:大量的产品质量检测仍依赖人工进行,以终端生产为例,QC(质量控制)在生产线工人中所占比例越来越高,而一种产品的缺陷种类往往多达几十或上百种,通常存在难检、漏检和误检的问题,机器视觉与人工智能为解决产品质量检测的痛点和难点提供了希望。

算法需要具备对环境的适应性包括:

  1. 平移不变性和旋转不变性(即被测目标在视场内有平移或旋转,算法也能准确匹配图像中的被测目标,并返回其位置和相对模板图像的旋转角度)
  2. 目标交叠(被测目标之间相互覆盖时,算法应仍能正确匹配到目标,并返回被覆盖部分占整个目标的比例)
  3. 图像尺度变换
  4. 光线强度线性或非线性变化
  5. 噪声和模糊目标

图像模板匹配

通过分析图像和目标图像中灰度、边缘、外形结构以及对应关系等特征的相似性和一致性,从目标图像中寻找与模版图像相同或相似区域的过程。一般输出为匹配目标的数量、相似度、位置和角度相对于模板的缩放比例一般分为学习和匹配两个阶段。

  • 学习:从模板图像中提取特征信息,并将它们以便于搜索的方式存放在模板图像库中以备后用。
  • 匹配:从被测目标图像中提取同类型的特征信息,分析它们与模板图像中的特征信息的相似性和一致性,以确定目标图像中与模板图像相匹配的区域。

图像相减

使用图像相减进行缺陷检测,参与运算的图像至少满足如下条件:

  • 目标图像和模板图像中的被测件图像尺寸相同
  • 目标图像和模板图像中的被测件图像对准准确
  • 目标图像和模板图像中被测件对于模板图像不存在畸变或畸变已经被矫正
  • 目标图像和模板图像中的被测件图像不存在整体灰度差异
  • 其他噪声的影响已提前被消除

深度学习

基于深度学习技术获取目标的类别、位置或像素级的分割,此方法首先需要创建数据集,利用深度学习对各产品表面缺陷形态特征进行学习,建立深度学习模型,从而可以分析更加复杂的图像,并提高对图像的分析能力,以此实现自动定义新的缺陷类型。

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
2020人工智能与机器学习创新峰会PPT汇总,24个专题共73份资料。供大家学习参考。 一、测试新趋势 业务数据监控从0-1脱敏 AI在游戏数值与平衡性分析中的应用 微众研发效能改进之数据度量体系 敏捷测试团队转型实践 二、大规模机器学习算法 快速深度学习训练优化算法 三、高效运维 构建全链路数据度量体系、实现DevOps数据驱动闭环 既快又好 DevOps为小红书全员质量保障赋能 浙江移动AIOpsDev运维转型实践-脱敏版 四、工业4.0 AI赋能医药工业发展案例 五、机器学习框架 Volcano加速AI云原生迁移之路 基于分布式机器学习的通信网络资源协同优化和分配 如何做智能边缘计算 六、计算机视觉 深度学习Depth预测--在2d-to-3d项目中的应用 PaddleOCR产业实践之路:如何打造8.6M超轻量模型,一条龙解决训练部署问题 视觉问答与对话系统的新技术进展 视觉技术赋能高效淘宝素材质量巡检 七、架构演进 边缘计算的缘起、价值和实践 AI人脸识别应用技术方案选型与架构落地 爱奇艺 K8S GPU 共享虚拟化实践和优化 菜鸟运力平台架构演进 八、流式计算 美团点评实时计算平台 小米实时计算平台构建 超大规模 Flink 调度优化实践 九、落地"大中台"战略 有赞数据中台降本治理 演进式的大规模业务中台体系落地实践 京东B2B中台化实践A2M 十、企业级大数据架构演进 基于阿里云数据湖分析服务DLA快速构建数据湖解决方案 Delta Lake在实时数仓中的应用实践 滴滴数据平台建设实践 美图PB级大数据基础架构升级之路 十一、区块链 新基建下可信区块链网络建设 基于区块链的药品溯源体系建设 区块链+电子合同 确保效力 放飞效率 千里之堤溃于蚁穴 十二、数据库的未来 PB级结构化日志数据的高效处理 TBase多中心多活应用实践 使用 TiDB 列存引擎进行实时数据分析 十三、图神经网络、知识图谱 知识图谱在内容安全中的实践应用 百度事件图谱技术与应用 华为云知识图谱平台技术及案例分享 知识图谱在腾讯AI医疗的应用实践-脱敏版 十四、推荐系统 多模态内容理解在推荐系统的应用 小红书推荐系统的架构演进 知乎搜索排序模型实践 十五、微服务的2.0时代 如何优雅的步入微服务2.0时代(脱敏版) 微服务之后,分层架构该如何演进 微服务网关(2) 十六、云原生构建之路 从0到1构建云原生智能金融电商-脱敏版 Tars与k8s如何结合,助力阅文海外业务 云原生应用性能优化之道 Dubbo 基于 MOSN 在 Service Mesh 场景下的落地实践-曹春晖 十七、智慧金融 智慧金融的新基础设施-数据中台-A2M 自然语言处理在金融实时事件监测和财务快讯生成中的应用 联邦学习在金融安全领域的研究与应用 人工智能Fairness在金融行业的研究:基于Pipeline的方法 十八、智能数据分析 闲鱼纳米镜--人人都是数据分析师 大数据分析系统在游戏领域的实践 十九、智能语音 智能语音交互 面向自然交互的多模态人机交互解决方案 二十、AI基础设施建设 飞桨开源模型库与行业应用 基于飞桨的深度学习全流程开发实战 NLP定制化训练实践1.3 二十一、AIOps AItest 百度AIOps解决方案及行业落地案例--脱敏 邱化峰-使用AI从业务测试走向业务验证 面向人工智能的测试体系建设 - 脱敏 二十二、FinTech 恒生银行DevOps实践和探索 数字化转型:从内部一体走向内外一体 基于区块链的隐私支付分析与比较 二十三、IOT 数字化转型升级 AIoT在工业水处理中的应用和实践及对永续发展的意义 二十四、NLP 阿里小蜜DeepQA算法平台化大规模提效实践 多模态内容生成在京东商品营销中的探索与实践

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI Player

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值