从图像中识别和读取数字

Happy Monkey

于 2024-08-06 04:47:43 发布

阅读量960

点赞数 32

分类专栏：自动识别 OCR 字体识别文章标签： python 计算机视觉人工智能图像处理机器学习目标检测

本文链接：https://blog.csdn.net/zhangyy57/article/details/140942628

版权

自动识别同时被 3 个专栏收录

45 篇文章 0 订阅

订阅专栏

字体识别

16 篇文章 0 订阅

订阅专栏

OCR

7 篇文章 0 订阅

订阅专栏

下述代码是一个使用HALCON软件编写的OCR（光学字符识别）程序，它主要用于从图像中识别和读取数字。

read_image (Image, ‘ocr/color_form_01’)
get_image_pointer3 (Image, PointerRed, PointerGreen, PointerBlue, Type, Width, Height)
dev_close_window ()
dev_open_window (0, 0, Width, Height, ‘black’, WindowID)
dev_display (Image)
dev_set_line_width (3)
dev_set_draw (‘margin’)
dev_update_window (‘off’)

Read the classifier to use for reading the text.
It is easiest to use the pre-trained font Industrial_0-9_NoRej. If you
have run the program ocrcolort.hdev in this directory, you can activate
the second line to use the font trained with this program.
read_ocr_class_mlp (‘Industrial_0-9_NoRej’, OCRHandle)
read_ocr_class_mlp (‘ocrcolor’, OCRHandle)
LOOP: Process all Images

NumImages := 8
for img := 1 to NumImages by 1
read_image (Image, ‘ocr/color_form_0’ + img)
*
* Detect foreground
*
mean_image (Image, Mean, 3, 3)
decompose3 (Mean, Red, Green, Blue)
threshold (Green, ForegroundRaw, 0, 220)
clip_region (ForegroundRaw, Foreground, 3, 3, Height - 4, Width - 4)
*
* Divide colors
*
reduce_domain (Red, Foreground, RedReduced)
reduce_domain (Green, Foreground, GreenReduced)
sub_image (RedReduced, GreenReduced, ImageSub, 2, 128)
mean_image (ImageSub, ImageMean, 3, 3)
binary_threshold (ImageMean, Cluster1, ‘smooth_histo’, ‘dark’, UsedThreshold)
difference (Foreground, Cluster1, Cluster2)
concat_obj (Cluster1, Cluster2, Cluster)
opening_circle (Cluster, Opening, 2.5)
smallest_rectangle1 (Opening, Row1, Column1, Row2, Column2)
WidthCluster := Column2 - Column1 + 1
if (WidthCluster[0] > WidthCluster[1])
select_obj (Opening, NumberRegion, 2)
else
select_obj (Opening, NumberRegion, 1)
endif
*
* Expand Numbers
*
closing_rectangle1 (NumberRegion, NumberCand, 1, 20)
difference (Image, NumberCand, NoNumbers)
connection (NumberRegion, NumberParts)
intensity (NumberParts, Green, MeanIntensity, Deviation)
expand_gray_ref (NumberParts, Green, NoNumbers, Numbers, 20, ‘image’, MeanIntensity, 48)
union1 (Numbers, NumberRegion)
connection (NumberRegion, Numbers)
*
* Fine tuning
*
fill_up_shape (Numbers, RegionFillUp, ‘area’, 1, 100)
opening_circle (RegionFillUp, FinalNumbersUnsorted, 3.5)
sort_region (FinalNumbersUnsorted, FinalNumbers, ‘character’, ‘true’, ‘row’)
dev_set_color (‘blue’)
dev_display (Image)
dev_display (FinalNumbers)
count_obj (FinalNumbers, NumNumbers)
union1 (FinalNumbers, NumberRegion)
difference (Image, NumberRegion, NoNumbers)
paint_region (NoNumbers, Green, ImageOCRRaw, 255, ‘fill’)
paint_region (NumberRegion, ImageOCRRaw, ImageOCR, 0, ‘fill’)
*
* OCR
*
do_ocr_multi_class_mlp (FinalNumbers, ImageOCR, OCRHandle, RecChar, Confidence)
set_display_font (WindowID, 27, ‘mono’, ‘true’, ‘false’)
disp_message (WindowID, sum(RecChar), ‘window’, 32, 24, ‘blue’, ‘false’)
if (img < NumImages)
set_display_font (WindowID, 16, ‘mono’, ‘true’, ‘false’)
disp_continue_message (WindowID, ‘black’, ‘true’)
stop ()
endif
endfor
clear_ocr_class_mlp (OCRHandle)
dev_update_window (‘on’)