如何使用Selenium自动化测试工具获取动态图片验证码？

最新推荐文章于 2025-04-02 16:34:33 发布

软件测试小仙女

最新推荐文章于 2025-04-02 16:34:33 发布

阅读量2.8k

点赞数

文章标签： selenium python 功能测试压力测试软件测试

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/deerxiaoluaa/article/details/124410756

版权

关于图片验证码的文章，我想大家都应该看过类似的文章了。

在我们做UI自动化的时候，经常会遇到图片验证码的问题。

当开发不给咱们提供万能验证码，或者测试第三方网站比如知乎的时候，我们就需要自己去识别验证码。

OCR

OCR是一种图像文字识别的技术，例如图中的验证码，我们用肉眼识别就是c5s3，但机器可不比咱们肉眼。所以我们要利用ocr技术，让我们的Python脚本自动通过图片识别出对应的文字。

常见的识别类库

在Python中其实有许多识别类库，这里只介绍博主自己实践过的成功率还不错的: 百度ocr。

简单的说，就是百度提供了一个SDK，让我们传入图片数据，从而拿到识别的结果。ocr的细节我们不需要关心。

申请开通OCR

首先我们得有一个百度账号，这个相信大家都有，没有的可以申请一个。

登录百度控制台，进入https://login.bce.baidu.com/并登录。

选择文字识别：

创建应用：

填写相关应用信息：

创建好了之后可以看到具体的应用信息，记住这3个关键信息。待会会用到。

·appid

·apikey

·secret key

熟悉OCR文档

官方文档地址: https://cloud.baidu.com/doc/OCR/s/wkibizyjk

文档会写的比较清楚，简单的说就是通过你的appid,api key和secret key获取一个client，接着你就可以调用client的api去获取图片中的文字了。官方的SDK还是比较贴心的。

·安装 SDK

pip install baidu-aip

讲完了文字怎么识别，接着就来说说标题中的动态图片验证码。

动态图片验证码

这个概念是我自己命名的，一般来说，我们的一张图片都是对应唯一一个 url 的，比如:

https://yuque.com?image=dshqadiau

(这个地址是我编的)一般来说 image 字段的值不同，图片也就不同，都是一串随机的或者规律的不重复数据，确保图片不会重复。

但是博主最近遇到了这样一种情况:

输入一个 url，每次输入，拿到的图片都不一样。

这样就会带来一个很严重的问题，页面上你虽然读取了图片的信息。我们把图片的url 传递给百度 sdk 的时候，url 由于再次调用，导致图片发生了变化。

比如网站上显示的是: c5s3，调用百度 sdk 的时候，百度会通过 url 读取图片，但再次读取，图片可能变成了 lfew。

不信大家可以看看这个图片地址:

怎么解决呢？

好在百度 sdk，他不仅仅支持 url，还支持图片文件和 base64 的图片数据。我们看看官方文档:

再回到 Selenium 里面，我们怎么才能获取到验证码那张图片呢？

思考一下:

1.读取 img 标签的 src，然后下载图片，保存图片文件再转为 base64，很显然这个方法行不通，为什么呢？

因为 img 的 src 属性就是刚才这个 url，你去获取一遍 url，它同样会变化。

2.截图，裁剪出验证码部分，扔给百度去识别可行是可行，但是会不会太复杂了？

如果我只对验证码的 img 元素进行截图，生成 base64 的数据是不是更方便？

其实呢，selenium 作为一款老牌的自动化测试工具，很多方法供大于求了。所以它是有这样的功能的！

最后：

可以我的个人V：atstudy-js，可以免费领取一份10G软件测试工程师面试宝典文档资料。以及相对应的视频学习教程免费分享！，其中包括了有基础知识、Linux必备、Mysql数据库、抓包工具、接口测试工具、测试进阶-Python编程、Web自动化测试、APP自动化测试、接口自动化测试、测试高级持续集成、测试架构开发测试框架、性能测试等。

这些测试资料，对于做【软件测试】的朋友来说应该是最全面最完整的备战仓库，这个仓库也陪伴我走过了最艰难的路程，希望也能帮助到你！

软件测试小仙女

博客等级

码龄6年

370
原创

1854
点赞

2896
收藏

1256
粉丝

关注

私信

热门文章

最新评论

车载测试：详解ADAS传感器（相机）标定数据采集方法
fjiemin: 第4 标定板外参图像拍摄这个是不是内参标定啊
什么是Python爬虫？一篇文章带你全面了解爬虫
北风之神c: 总结的很全面的爬虫，写得赞，博主用心了。此国产分布式函数调度框架 funboost python万能通用函数加速器 https://funboost.readthedocs.io/zh-cn/latest/articles/c8.html ，只需要@boost一行代码，加到任意新/旧爬虫项目就又强又自由又简单。 funboost 分布式函数调度框架，定位于调度用户的任何函数，只要用户在函数里面写爬虫代码，就可以分布式调度爬虫，并且对爬虫函数施加30种控制功能,例如 qps恒定任何时候随意关机重启代码消息万无一失确认消费非常简单的开启多进程叠加线程/协程,这些强大的功能绝大部分爬虫框架还做不到。此框架如果用于爬虫，不管从任何方面比较可以领先scrapy 20年，也比任意写的爬虫框架领先10年。普通爬虫框架一般就设计为url请求调度框架，url怎么请求都是被框内置架束缚死了，所以有些奇葩独特的想法在那种框架里面难以实现，用户需要非常之精通框架本身然后改造框架才能达到随心所欲的驾驭的目的。普通的爬虫框架与用户手写requests 请求解析存储，在流程逻辑上是严重互斥的，要改造成使用那种框架改造需要大改特改。而此框架是函数调度框架，函数里面用户可以随意写一切任意自由想法，天生不会有任何束缚。使用funboost爬虫，与用户使用别的爬虫框架或者无框架用户手写多线程爬虫相比， funboost都代码更少更强更简单更自由。 pip install funboost 或者是直接使用 pip install boost_spider (powerd by funboost ，boost_spider比funboost增加了更加专门的针对爬虫请求和解析和存储） https://github.com/ydf0509/b
AI测试干货！实例讲解AI自动生成测试用例
m0_49346729: 有成熟的平台吗
如何使用python实现高通工具自动化？两个工具QXDM&QCAT教会你！
frankgogoland: 麻烦，还是用第三方工具吧，比如cellular pro
技术分享：如何用pytest_addoption切换自动化测试环境？
CSDN-Ada助手: 恭喜你，获得了 2023 博客之星评选的入围资格，请看这个帖子（https://bbs.csdn.net/topics/616690233?utm_source=blogger_star_comment）。请在这里提供反馈： https://blogdev.blog.csdn.net/article/details/129986459?utm_source=blogger_star_comment。

最新文章

2025

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。