【机器视觉】tesseract基本使用

最新推荐文章于 2023-09-08 09:00:00 发布

AI study

最新推荐文章于 2023-09-08 09:00:00 发布

阅读量747

点赞数

分类专栏：计算机视觉文章标签： tesseract 机器视觉验证码识别人工智能 pytesseract

本文链接：https://blog.csdn.net/weixin_43797885/article/details/104390328

版权

计算机视觉专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1.1tesseract

1.1.1基础知识

主要用来文字图片的识别，验证码的识别等。就是将图像翻译成文字，也就是文字识别，是由googl公司推出的

安装包下载地址训练数据集下载地址

使用方式

百度搜索：tesseract，下载该软件，安装
设置该软件的环境变量
在含有想要识别的文件中打开cmd，使用命令tesserct 图片名.png 文本文件名
如果想要识别中文数据，我们可以通过更改训练数据的包来更改。首先，在tesseract中找到目录tessdata，将该数据集中的eng.traineddata文件替换成我们从网上下载的训练集，名字要和原来的文件的名字一样。

1.1.2tesseract使用案例

需要识别的图片

执行的命令

tesseract meiwen.png meiwen

识别出的文本

1.2pytesseract库

1.2.1基础知识

如果上述可以成功完成，我们就可以使用代码实现验证码的自动化识别了，首先安装：pip3.6 install pytesseract，然后进行下列代码操作。如果遇到没有找到pytesseract的错误，我们可以重启pycharm解决(原因：你虽然设置了环境变量，但是pycharm并不知道你已经设置了。必须重启pycharm重新加载环境变量。)

driver.save_screenshot('./poem.png') # 将浏览器对象保存在该路径下
image=Image.open('./poem.png') # 打开该路径下的图片文件
result = pytesseract.image_to_data(image) # 解析该图片的信息
result = pytesseract.image_to_string(image) # 识别该图片的文本内容
image.show() # 展示打开的图片文件
driver=webdriver.Chrome(default='python解释器路径') # 创建Chrome对象
code=driver.page_source # 页面源码获取到的是页面源码

1.2.2使用案例

pytesseract案例

AI study

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【机器视觉】tesseract基本使用

1.1tesseract1.1.1基础知识主要用来文字图片的识别，验证码的识别等。就是将图像翻译成文字，也就是文字识别，是由googl公司推出的安装包下载地址训练数据集下载地址使用方式百度搜索：tesseract，下载该软件，安装设置该软件的环境变量在含有想要识别的文件中打开cmd，使用命令tesserct 图片名.png 文本文件名如果想要识别中文数据，...
复制链接

扫一扫