python图像识别与文字处理(tesseract下载、环境配置、相关代码)
相关代码有:读取图像中格式规范的文字、对图片进行阈值过滤和降噪处理、识别图像验证码、识别图像中的中文字符
1、先下载tesseract
一直点默认选项安装即可,不过需记住安装路径,安装好后,如下文件夹(名字自定义的)
2、(不识别中文的不用)下载chi_sim,并放入tesseract下的tessdata文件夹中
直接拖进去就行
3、配置环境变量
此电脑——右键——属性——在输入框输入 :查看高级系统设置——进入此界面
点击环境变量
上下两个Path都配(不知道选哪个所以都配咯)
1、点击Path——编辑——新建——写刚刚的安装路径(如: C:\Program Files (x86)\Tesseract-OCR)
2、在系统变量(下面那个)中再另外多配一个
直接点这里的新建——变量名写:TESSDATA_PREFIX;变量值写刚刚的路径(如: C:\Program Files (x86)\Tesseract-OCR)
好了一直按确定确定确定,over
4、cmd一下,检查是否好了
输入tesseract -v 出现下图即搞定了