Halcon学习笔记（八）——OCR初步创建并训练OCR分类器

最新推荐文章于 2025-03-13 21:54:30 发布

ThetaQing

最新推荐文章于 2025-03-13 21:54:30 发布

阅读量4.5k

点赞数 2

分类专栏： halcon学习笔记

本文链接：https://blog.csdn.net/Thera_qing/article/details/99226935

版权

本文是关于Halcon OCR的初步学习，通过分析letter_mlp例程，介绍了如何创建和训练OCR分类器。从读取图片、形成训练数据、分割排序、建立字符关联文件、训练分类器到测试和显示，详细讲解了每个步骤，为OCR识别打下基础。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

第一讲

OCR：（Optical Character Recognition，光学字符识别）是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程；即，针对印刷体字符，采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件，并通过识别软件将图像中的文字转换成文本格式，供文字处理软件进一步编辑加工的技术。如何除错或利用辅助信息提高识别正确率，是OCR最重要的课题，ICR（Intelligent Character Recognition）的名词也因此而产生。衡量一个OCR系统性能好坏的主要指标有：拒识率、误识率、识别速度、用户界面的友好性，产品的稳定性，易用性及可行性等。
摘自百度百科
这一部分我们主要利用letter_mlp的例程进行分析，这个例程展示了怎样实现一个简单的OCR分类器，下面进行逐句解读。
首先我们要创建一个分类器是用于训练的，按照训练的思路，第一步就是要有训练字符，第二步是要知道训练字符的标签，第三步才是进行训练。下面我们一步一步来实现。

第一步：读取图片和显示图片，并获取图片参数，主要是长和宽，这里dev_open_window_fit_image (Image, 0, 0, -1, -1, WindowHandle)表示打开一个适应图像尺寸的窗口，并设置颜色，获取图片路径之后定义训练文件名。

* This example program shows how to use a simple MLP OCR classifier
*
dev_update_off ()
read_image (Image, 'letters')
get_image_size (Image, Width, Height)
dev_close_window ()
dev_open_window_fit_image (Image, 0, 0, -1, -1, WindowHandle)
dev_set_colored (12)
set_display_font (WindowHandle, 16, 'mono', 'true', 'false')
get_tmp_dir (TmpDir)
TrainFile := TmpDir + '/letters.trf'
dev_display (Image)

执行这一段代码之后得到