起初想到做这个是因为项目里有几个发光字要识别,而Halcon自带的OCR里面没有找到汉字的分类器,所以想着自己训练一下,这样可以更有针对性。
做为一个肤浅的初学者,学halcon也是个逐步摸索的过程,感谢老乡Z提供的入门资料,这里记录下实验过程。
步骤:
创建训练文件。
训练OCR分类器
识别测试图像。
创建训练文件
这一步主要是把训练图像中的汉字部分图像和文字符号关联起来。比如图像中找到了几个汉字区域,我们把这几个字的区域存储下来,然后建立个数组,里面放进去跟存储区中一一对应的汉字字符,这样就建立了关联。然后把这个关联关系存储在一个.trf文件中。
训练OCR分类器
这部分由两个选择,可以用svm,也可以用mlp。这里我用了mlp作例子。训练这个过程比较简单,主要是三个函数:
create_ocr_class_mlp
trainf_ocr_class_mlp
write_ocr_class_mlp
create_ocr_class_mlp (8, 10, 'constant', 'default', CharacterNames, 80, 'none&