python对图像文字进行识别

图像识别—tesseract

Python进行图像识别主要是要安装pillow包,和pytesseract

并且系统得安装软件tesseract,同时,记得如果想要识别汉字,需要载入中文包,

经过我的反复实践,发现tersseract虽然对英文的识别成功率很高,但是对中文却不是友好,应该是汉化中文包训练不足吧

所有就提供一些链接供大家思考,不再重点讨论

https://www.liangzl.com/get-article-detail-17307.html

https://www.cnblogs.com/wobeinianqing/p/8663733.html

https://github.com/tesseract-ocr/tessdata/blob/master/chi_sim.traineddata

https://github.com/tesseract-ocr/tessdata

下载中文包

https://www.cnblogs.com/nyist-xsk/p/7762476.html

图像识别baidu-aip

    百度aip针对多个语言提供SDK

    鉴于python的简洁性,我们就以python为例,目前百度智能云产品提供给个人使用免费,当然收费的功能比个人功能强大的多

pip install baidu-aip

https://cloud.baidu.com/doc/OCR/OCR-Python-SDK.html#.E5.AE.89.E8.A3.85OCR.20Python.20SDK

 

 

 

 

 

识别所采用的的实例文件

从上面结果可以看出如果只打印百度云给你识别的结果我们会发现结果断断续续,所以我对结果进行提取,拼接,是不是更适合人类阅读

今天的分享到此结束

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值