Tesseract-OCR 5.0 LSTM训练 - 血的教训


由于工作需要识别一些验证码,图形不复杂。调用别人家的库花了不少冤枉钱,产生了自己搞的想法。网上的教程大都过期了。经过很久的折腾终于找到这篇教程 https://www.cnblogs.com/nayitian/p/15240143.html比较靠谱。作者大神自己可以避坑,我等菜鸟就惨了。又折腾了两天,终于在无数次准备放弃之后,终于找到的错误的地方。过程中,openchat功劳不小。啥时候中国可以自己搞出来啊!!

1 、二值化

无论是训练的tiff文件,还是最后匹配的时候,最好二值化。免得出现很多意想不到的事故。
openchat建议,训练时最好用原图,我等下再用原图试试。我还没试,如果你们也遇到莫名其妙的问题,可以用opencv二值化后处理

2、生成tiff文件时,最好不要用第三方工具。

最好使用python的opencv库处理,输出扩展名指定为tiff就行,cv库会根据扩展名自己转换格式。不正确的tiff文件会在"原文 步骤六、生成.lstmf文件用于lstm训练"时,出现很多不可思议的错误,包含部分页面报错、训练出来的库啥用没有、要求创建 lstm文件等不可理喻的故障。郁闷的是我都遇到了,最后用opencv自己处理了一遍图片样本后,生成过程无比顺利,一点问题都没出。

3、注意更改参数

无法准确识别或训练时,更改合适的 -oem参数及 --psm参数

代码片段,转换为opencv库转换为 tiff格式

# 用 openov转换为tiff格式,用于训练,避免意想不到的问题.
img = cv2.imread(imgFile, settings.loadingMode)
_, binary_img = cv2.threshold(img, 254, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)  # OTSU二值化
cv2.imwrite(self.imagePack.fileName + ".tiff", self.imagePack.img)

代码片段,识别文字

# 识别文字 识别时指定图片的psm 用config
pytesseract.pytesseract.tesseract_cmd = r'd:\Program Files\Tesseract-OCR\tesseract'
tessdata_dir_config = r'--tessdata-dir "d:\Program Files\Tesseract-OCR\tessdata"'
_, binary_img = cv2.threshold(img, 254, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)  # OTSU二值化
result = pytesseract.image_to_string(binary_img, lang='num', config='--psm 6')[:4]  # 识别并返回结果 pytesseract很操蛋的是会返回一个换行符而且我要识别的验证码只有四位,干脆直接截取了

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值