pytesseract 使用框架

最新推荐文章于 2020-12-21 01:16:59 发布

weixin_30342827

最新推荐文章于 2020-12-21 01:16:59 发布

阅读量59

点赞数

原文链接：http://www.cnblogs.com/zenan/p/9242016.html

版权

import pytesseract
import cv2


img = cv2.imread("captcha.jpg",0)
try:
    img.shape
except AttributeError:
    pass
else:
    code = pytesseract.image_to_string(img)
    print(code)

接口就是pytesseract.image_to_string(),前提就是需要安装tesseract-OCR，并加入环境变量。

这里再记录一下识别中文的流程：

1. 下载二进制windows安装包

https://github.com/tesseract-ocr/tesseract/wiki/4.0-with-LSTM#400-alpha-for-windows

一键傻瓜式安装。安装完成后不要忘记把tesseract.exe所在路径加入环境变量。

2.安装简体中文包

https://github.com/tesseract-ocr/tessdata

下载chi_sim.traineddata并将其放入C:\Program Files (x86)\Tesseract-OCR\tessdata路径下。

最后，可以识别了，但是识别率惨的一批。。。。还需要我们训练自己的字体库。

转载于:https://www.cnblogs.com/zenan/p/9242016.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_30342827

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pytesseract 使用框架

import pytesseractimport cv2img = cv2.imread("captcha.jpg",0)try: img.shapeexcept AttributeError: passelse: code = pytesseract.image_to_string(img) print(code)...
复制链接

扫一扫