Python本地搭建Tesseract,简单识别图片文本内容
1.首先python版本要是3.6以上
2.需要有pillow模块,没有的话用pip安装
3.需要安装pytesseract,没有的话也需要pip安装,pip install pytesseract
4.再者,还需要最重要的tesseract-ocr包,同样,也需要用pip安装,pip install tesseract-ocr
到此,如果tesseract-ocr安装成功,那么基本上也就成功一半了,但,遗憾的是,这一步绝大多数人是安装失败的,最后的报错信息如下。
error: Microsoft Visual C++ 14.0 is required. Get it with “Microsoft Visual C++ Build Tools”: http://landinghub.visualstudio.com/visual-cpp-build-tools
这里显然通过pip是安装不了,而且通过装C++环境也太过繁琐,博主我通过强大的度娘给自己找到了一条简单一点的道路,也供大家参照。
通过这个链接https://github.com/tesseract-ocr/tesseract/wiki 大家可以找到自己对应的操作系统的版本,大家常用的windows版本博主我也在这里列出详细的地址,https://github.com/UB-Ma