tesseract如何限定识别的文字

最新推荐文章于 2024-01-17 15:13:46 发布

weixin_33695450

最新推荐文章于 2024-01-17 15:13:46 发布

阅读量1.2k

点赞数 1

文章标签： python

原文链接：https://my.oschina.net/u/2396236/blog/1621590

版权

本文介绍了如何使用Tesseract OCR工具限定识别特定文字，如身份证号码，通过配置白名单提高识别准确率，并讲解了语言设置、语言叠加、查看语言包及配置参数-PSM的用法。

摘要由CSDN通过智能技术生成

2019独角兽企业重金招聘Python工程师标准>>>

这是一篇tesseract使用备忘录，其中主要论述限定要识别的文字

网址：

tesseract项目网址是：http://code.google.com/p/tesseract-ocr/

命令行的使用：

tesseract xxx.jpg result.txt -psm 7 digit

解释

tesseract 命令名

xxx.jpg 文件名，jpg,png都可以

result.txt 识别出的文字输出到文件

-psm 7 digit 参数

限定要识别的文字

例如要识别身份证号码，一般身份证号码为数字0到9还有大写的X，

加了限定以后

最低0.47元/天解锁文章

weixin_33695450

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。