一、重要算子
OCR分类器其实有很多,如下图所示。但是通常mlp分类器效果较好,使用较多。
主要算子如下:
① append_ocr_trainf(Character, Image : : Class, TrainingFile : )
四个参数分别是:字符Region、字符Image、字符文本、OCR训练的.trf文件路径。
如果该路径下不存在.trf文件,那么它会自动生成该文件。
该算子作用是将单个字符区域、单个字符图像和对应的字符文本写入TrainingFile 文件。
② read_ocr_trainf_names( : : TrainingFile : CharacterNames, CharacterCount)
查询.trf训练文件中存储有哪些字符,以及每个字符在训练器中的数量。
③ create_ocr_class_mlp(42, 67, 'constant', 'default', CharacterNames, NumHidden, 'none', 10, 42, OCRHandle)
最前面的两个参数分别指字符的宽度和高度。NumHidden指隐藏层的层数,一般不宜过低。
④ trainf_ocr_class_mlp( : : OCRHandle, TrainingFile, MaxIterations, WeightTolerance, ErrorTolerance : Error, ErrorLog)
训练神经网络,通常参数用默认值即可。
⑤ write_ocr_class_mlp( : : OCRHandle, FileName : )
保存OCR的的.omc分类器到文件。<