三、仪表读数识别算法的开发——1. 整体思路

-- 好名字 --

已于 2022-04-15 22:04:54 修改

阅读量4k

点赞数 9

分类专栏：基于机器视觉的仪表读数识别系统文章标签：图像处理

于 2022-04-15 22:03:52 首次发布

本文链接：https://blog.csdn.net/weixin_37789780/article/details/124202883

版权

10 篇文章 3 订阅

订阅专栏

仪表读数识别算法的开发——1. 整体思路

前面两章内容已经完成了：

可以说是准备工作和硬件模块的驱动已经完成，地基已经打好了。接下来就进入到核心的图像识别算法部分，开始建楼。
这一节不介绍详细的算法实现，而是先看一下算法实现的整体思路（你也可以认为是“技术路线”）。

在解释算法实现之前，我们要先明确目标是什么，也就是要实现什么样的图像处理效果。
要做仪表读数识别，就是要在一张图片中，找到仪表的数字显示区域，然后把数字显示区域中的显示内容识别出来，最终得到一个与读数相同的字符串，像下面这张图这样。
在这里插入图片描述

基于图像处理的仪表读数识别主要包括图像预处理、数字显示区域分割、图像阈值分割、字符分割与字符识别五个步骤。处理的过程大概是这样的。
在这里插入图片描述
具体来说：

下面用表格直观、简要地给出每个步骤我所使用的方法，以及选择这个方法的原因。（由于图像预处理方法要根据获取到图像的质量确定，所以就不在表格中呈现了。）

步骤	现有方法	所用方法	选择原因
分割数字显示区域	利用图像的形状、颜色特征，基于边缘提取、筛选的传统图像处理方法；深度学习的方法。	传统的图像处理方法	用深度学习的方法跑网络、训练模型虽然方便，但其推理时间是我预期的2~3倍，树莓派的算力也确实有限，遂放弃；传统的方法所需要的处理时间能够完全满足我的需求，最后识别一张图片中3个仪表的数显内容可以控制在260ms以内。但是用传统的方法很难考虑到所有的情况，适配性欠佳，因此后期的现场调试就尤为重要。
图像二值化	全局阈值法（OTSU、三角法）和局部阈值法	全局阈值法（三角法）	目前仅用全局阈值法就能够取得较好的效果，且现场光照条件较均匀稳定。
字符分割	投影法等	投影法	与手写字符不同，数码管显示的字符形状规则，但同时也具有笔画不连续的特点。针对这样的特点，投影法是是应用较多的一种方法。
字符识别	模板匹配法、穿线法、基于不变矩信息融合及神经网络分类器的方法、KNN算法、K-Means算法等	穿线法	数码管显示字符的一致性好，特点明确。