原标题:HALCON高级篇:OCR识别
OCR
光学字符识别(OCR)是识读的一个技术术语,例如识别符号。在HALCON中,OCR被定义为去解释图像区域的特定任务。典型的,这些区域代表了多个单个字符,因此我们将其认为识读单个符号。
在离线阶段,每个字符通过几个样本被训练。在线阶段,图像被分割去提取代表字符的区域,然后运用OCR阅读器去解释每个字符。
OCR识别包含这么几个主要步骤,第一部分是离线,由收集训练样本,然后去训练组成。在线部分由提取字符和识读它们组成。
OCR的优势是训练的灵活性,其运行去选择为特定应用优化的特征。还有,你可以在基于最新技术的不同分类器之间进行选择,提供最优可能的性能。
还有一个更大的优势,HALCON提供一组预先训练好的字体,这些字体是基于来自不同应用领域大量的训练数据,这些字体运行你去阅读文档里的文本,制药或者工业产品上的文本,点印文本,甚至是手写数字。还有,HALCON包含了为OCR-A, OCR-B和基于卷积神经网络(CNNs)的一般字体的与训练字体。
基本概念
OCR主要分了两个主要部分:训练和识读。每一个主要部分都要求额外的准备步骤:
获取图像
对于训练数据的产生和OCR本身图像都必须被获取。
分割图像
对于训练样本和在线识读过程,字符必须从图像中提取出来,这一步就是分割。这就意味着OCR算子,如