如标题所言,路径和库都安装好了,但是一直报错
UnicodeDecodeError: ‘utf-8’ codec can’t decode byte
代码如下
import pytesseract
from PIL import Image
if __name__ == '__main__':
text = pytesseract.image_to_string(Image.open("data/1.png"),lang="eng")
print(text)
网上找了很多博客和教程基本上都没能解决我的问题
后来在stackoverflow上找到了,其实很简单,把pytesseract卸载重装就好了
解决方法:
pip uninstall pytesseract
pip install pytesseract
那为什么会出现这个编码问题呢,我感觉是因为我之前装tesseract的时候,发现语言包不好装,然后我就把tesseract卸载了,但是呢,pytesseract没有卸载,这个时候可能会出现不对应的问题。因此要解决就把tesseract和pytesseract卸载重装就完事儿了