[视觉概述] 机器视觉应用方向、项目流程及学习思路总结

丶布布

已于 2023-06-21 10:49:25 修改

阅读量1.1w

点赞数 57

分类专栏：机器视觉文章标签：人工智能机器视觉学习方向

于 2019-05-24 21:12:50 首次发布

本文为博主原创文章，未经博主允许不得转载。如有问题，欢迎指正。

本文链接：https://blog.csdn.net/weixin_43197380/article/details/90523050

版权

机器视觉专栏收录该内容

2 篇文章

订阅专栏

📢博客主页：https://loewen.blog.csdn.net
📢欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正！
📢本文由丶布布原创，首发于 CSDN，转载注明出处🙉
📢现在的付出，都会是一种沉淀，只为让你成为更好的人✨

文章预览：

一. 机器视觉应用方向

机器视觉则是建立在计算机视觉理论的基础上，偏重于计算机视觉技术工程化。与计算机视觉研究的视觉模式识别、视觉理解等内容不同，机器视觉重点在于感知环境中物体的形状、位置、姿态、运动等几何信息。机器视觉主要分2D和3D两个方向：

2D：

识别定位：①Blob分析（主要包括二值化、形态学处理、特征选择。ps:受光照影响较大）②模板匹配（常用的是Shape匹配和Ncc匹配，有时还会用到可变形模板）；
符号需求（一维码、二维码、三维码、OCR光学字符识别）
测量类（单目相机的标定、相机自标定）；
缺陷检测系列；
视觉+运动控制板卡+机器人：手眼抓取（涉及手眼标定抓取等方面）

3D：

双目及多目相机标定；
鞋点胶;
无序抓取：参考Halcon【实例程序】中【方法】【多目立体视觉】locate_pipe_joints-stereo.hdev案例中;
核心知识点：3D手眼标定——标定3D传感器和机械手之间的关系;
点云数据+深度学习;

工具：Halcon（德国）、VisionPro（美国康耐视）、LabView、OpenCV+C++（Emgucv+C#）、Sherlock、Evsion、Insight、Matlab;

推荐：Halcon===>>>> OpenCV ====>>>> 源码自己编写

语言主流：C#+halcon（适合初学、开发效率快，但执行速度相对慢一些，因为C#需要翻译成机器语言）、C+++QT+halcon（适合有一定基础、开发效率慢（对开发者要求高一点），但执行速度更快，因为C++直接生成.exe文件，是操作系统可以直接执行的机器语言）、C+++MFC+halcon

二. 项目总体流程

做机器视觉的项目，拿到项目时一般遵循如下流程：

（1）需求分析（2D）

问题	说明
确定检测物体	检测的目标物是什么？形状是什么样的？物体具体尺寸是多少？
检测哪些指标	具体检测什么指标？有无？状态？尺寸？位置？粘连？差异？毛刺？颜色？
工作距离	安装摄像机到被测物体的最大允许距离是多少？可否自由调节？
分辨率多高	相机的测量尺寸精度是多高？
检测速度多快	全自动测量还是手动？每分钟测量多少个？
安装空间	被测零件周围是否有安装光源的位置？是否有适合安装摄像机头的位置？怎么样固定比较合适？
颜色	被测物体是什么颜色？我们是否需要对颜色判别？是否可以利用颜色差异帮助我们实现检测目的？
材质	物体是什么材料的，表面光学性质怎样？
合格判据	合格/不合格的定义
工位信号	有工位触发信号还是需要自动连续拍照？
剔除或控制方式	是否需要自动剔除残次品或控制机器动作？怎么样对不合格品进行剔除？使用什么信号格式，在什么位置进行？
工作环境	工作环境的温度、湿度、粉尘、防水、杂散光线情况
交货日期	这是不言而喻的

（2）方案设计（硬件）：

2D：根据客户应用的场合不同，选择相应的镜头、相机、支架、光源及如何打光（感兴趣的可看看《工程光学》一书）等。
3D：自己搭建双目结构光、激光三角等3D平台，或直接买市面公司成熟的3D方案（首先，因为速度更快、精度更高一些），相关3D硬件平台参考：主流3D光学视觉方案

（3）概要设计（软件）：

包含软件架构体系，视觉开发环境（VC+++Halcon还是C#+Halcon等）;
算法流程（怎么通讯、怎么识别等）。

（4）详细设计（软件）：

各个功能模块如何做，包括图像采集模块、处理模块、包括算法模块，如何通讯等；
通常将每个模块形成一个动态库，调用相应的接口函数即可，项目图像采集调用SDK也是调用动态库的过程；

（5）软件编码 —— （6）测试、调试和修改 —— （7）客户交付、确认 —— （8）调试：根据客户反馈结果来不断的修改程序Bug。

（9）达到客户需求，最后交付客户及软硬件操作文档 —— （10）后期维护。

三. 视觉常规算法流程

图像采集
图像预处理：包含几何变换、灰度处理、图像增强、图像滤波、二值化、图像细化等
注：图像预处理在视觉算法中一般是可选项，图像效果很好的时候可跳过该步
定位（blob分析、模板匹配）
特征提取：包含几何特征（面积、周长、矩形度）、纹理特征（与灰度相关，如熵、能量值）、概率特征、角点、特征描述算子特征等，直接影响定位、识别的效果
对特征区域进行处理（根据不同工业需求选择对应的检测识别算法）
结果显示

四. 机器视觉工程师需要具备的能力

4.1 图像处理相关知识

图像处理的基本理论知识（图像理论的基础知识）
图像增强（对比度拉伸、灰度变换等）
图像的几何变换（仿射变换，旋转矩阵等）
图像的频域处理（傅里叶变换、DFT、小波变换、高低通滤波器设计）
形态学（膨胀、腐蚀、开运算和闭运算以及凸壳等）
图像分割（HALCON里的Blob分析）
图像复原
运动图像
图像配准（模板匹配等）
模式识别（分类器训练，神经网络深度学习等）

学习参考资料：

经典教材：冈萨雷斯的《数字图像处理》及对应的MATLAB版
杨丹等编著《MATLAB图像处理实例详解》
张铮等编著《数字图像处理与机器视觉——Visual C++与MATLAB实现》
左飞编著的《数字图像处理：原理与实践（MATLAB版）》
左飞编著的《数字图像处理技术详解与Visual C++实践》
谢凤英编著的《Visual C++数字图像处理》
《精通系列·精通Visual C++数字图像处理典型算法及实现(第2版)》

4.2 软件编程功底

软件功底的作用是软件的架构设计分析，架构包括UI层设计、业务逻辑层开发、数据层开发。以下三个方面，每个方面至少会一种，具体选择视所在公司应用而定：

编程语言：C#，C，C++（自己用哪个就学哪个）
界面框架：C#界面，Qt界面，MFC界面（比较老了，以前的项目用的较多）
图像算法处理软件：HALCON，VisionPro，OpenCV等

学习资料参考：

C# 可以看书籍《C#从入门到精通》、《Head First C#》、《C#入门经典》、《C#图解教程》、《C#高级编程》、《.Net Frameword 高级编程》、《CLR via C#》
C 语言的学习主要看谭浩强写的C语言相关知识
C++主要看《C++ primer plus》书籍
Qt 学习可以看《Qt Creator快速入门》(入门)、《C++ GUI Qt4》(进阶)
MFC 的学习主要看孙鑫编写的《VC++深入详解》这本书及相应的视频教程，并在VC++6.0软件或VS2010等软件上编写程序和实践