自动化脚本无法处理验证码？Python图片识别库Tesseract实战

最新推荐文章于 2024-06-18 14:44:40 发布

码同学软件测试

最新推荐文章于 2024-06-18 14:44:40 发布

阅读量462

点赞数

分类专栏：软件测试 IT 程序员文章标签：自动化开发语言 python 软件测试测试工程师

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Testfan_zhou/article/details/122574765

版权

本文章出自【码同学软件测试】
码同学公众号：自动化软件测试
码同学抖音号：小码哥聊软件测试

前言：

在Ui测试的时候,有时我们会遇到”元素以图片的形式展示内容”(最经典的案例使验证码).这时传统的文档解析方案就失效了.
但是,Python中你可以轻易的使用ocr(光学字符识别)技术.对图片元素中的文字进行提取.从而解决技术难题.具体需要以下3步:
①安装Tesseract-ocr服务
②安装pytesseract-python驱动库
③识别图片

1.关于Tesseract

①Tesseract是一款由Google赞助的开源OCR。

②Tesseract 已经有 30 年历史，开始它是惠普实验室的一款专利软件，然后在 2005 年开源，自 2006 年后由 Google 赞助进行后续的开发和维护。

③在 1995 年 Tesseract 曾是世界前三的 OCR 引擎，而在现在的免费 OCR 引擎中，其识别精度也仍然是出类拔萃的。因为其免费与较好的效果，许多的个人开发者以及一些较小的团队在使用着 Tesseract ，诸如验证码识别、车牌号识别等应用中，不难见到 Tesseract 的身影。

④Tesseract(/‘tesərækt/) 这个词的意思的本意是”超立方体”.不过这里用到的，是一款以其命名的开源 OCR(Optical Character Recognition, 光学字符识别) 软件。

*所谓 OCR 是图像识别领域中的一个子领域，该领域专注于对图片中的文字信息进行识别并转换成能被常规文本编辑器编辑的文本。
安装：

1.安装Tesseract.exe
安装包已经上传到网盘之中
链接：https:

最低0.47元/天解锁文章

码同学软件测试

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
自动化脚本无法处理验证码？Python图片识别库Tesseract实战

自动化脚本
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。