python去除图片上的文字_python读取图片里面的文字

需要安装的依赖包:PIL  Pytesseract

1、安装包

PIL 就是pillow包,直接找到对应的whl包安装(https://www.lfd.uci.edu/~gohlke/pythonlibs/)

注意:pillow是用于替代PIL的,所以在实际使用中需要import PIL而不是pillow

Pytesseract 直接pip安装

注意:Pytesseract安装后不能直接使用,还需要安装Tesseract-OCR

安装Tesseract-OCR后记录安装路径:D:/Download/tesseract/tesseract.exe

在Pytesseract的源码中修改

源码路径:D:\Download\Anaconda\Lib\site-packages\pytesseract(我的Anaconda是安装在D:\Download文件夹中)

修改文件pytesseract.py(将下面一行的内容修改为上面一行):

tesseract_cmd = r'D:/Download/tesseract/tesseract.exe'

# tesseract_cmd = 'tesseract'

2、直接读取图片中的文字

from PIL importImageimportpytesseract

im= Image.open('001.png')

text=pytesseract.image_to_string(im)print(text)

注意:如果图片中有中文还需要下载中文库放在Tesseract-OCR的安装目录的tessdata 文件夹下

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值