python实现网站的自动登录（selenium实现，带验证码识别）

最新推荐文章于 2024-04-30 09:00:00 发布

纵曲枉直diN

最新推荐文章于 2024-04-30 09:00:00 发布

阅读量1.6w

点赞数 18

分类专栏： python 文章标签： python 爬虫 selenium 自动登录

本文链接：https://blog.csdn.net/Paramete/article/details/103318162

版权

python实现网站自动登录（selenium实现，带验证码识别）

一、前言

这是鄙人写的第一篇博客，旨在总结一下近期所学，本文通过selenium工具实现工作所用网站的自动登录，下图为网站登录界面。

1、运行环境

操作系统：Windows10
python版本：python3.7

2、需要的python第三方库

1、selenium
安装：pip install selenium

selenium是ThoughtWorks提供的一个强大的基于浏览器的开源自动化测试工具。支持的浏览器包括IE、Chrome和Firefox等。

另外还需要下载浏览器驱动，我这里用的是Google浏览器驱动。
Google浏览器驱动：官网地址

选择适配的浏览器版本和Windows系统，然后将下载得到的exe文件放到python的安装目录下。
2、baidu_api
安装：pip install baidu_api

baidu_api是百度文字识别的OCR（Optical Character Recognition，光学字符识别），很多人可能会用tesseract库，但以测试的效果来看，百度的API识别效果更好。了解此库大家可以看官方文档。百度OCR-API官方文档
3、pillow
安装：pip install pillow

pillow库是python最常用的第三方图像处理库

二、代码实现

1、导入第三方库

from selenium import webdriver
from PIL import Image
from aip import AipOcr

2、验证码的获取与处理

在进行验证码的获取之前，需要先实例化一个browser对象，代码如下：

browser = webdriver.Chrome()  # 实例化对象

获取验证码的方法是通过实例化后的browser对象的查找元素方法的得到验证码元素并截图。
下为网站源代码的验证码标签。

代码如下：

url = 'http://120.77.44.123/Login/Login.aspx?title=exit&recode=1'
browser.get(url)
png = browser.find_element_by_id('captcha_img')  # 查找验证码元素
png.screenshot('capt.png')  # 对验证码进行截图并保存

这是获得的验证码图片：
原始验证码图片
为了提高验证码的识别率，我们需要用pillow库对验证码进行图像处理。
处理方法如下：
1、先将图像转换成灰度模式
2、通过对阈值的调整使得多余的噪点消失

img = Image.open('capt.png')
img = img.convert('L')  # P模式转换为L模式(灰度模式默认阈值127)
count = 165  # 设定阈值
table = []
for i in range

最低0.47元/天解锁文章

纵曲枉直diN

关注

18
点赞
踩
165

收藏

觉得还不错? 一键收藏
14
评论
python实现网站的自动登录（selenium实现，带验证码识别）

python实现网站自动登录（selenium实现，带验证码识别）一、前言这是鄙人写的第一篇博客，旨在总结一下近期所学，本文通过selenium工具实现工作所用网站的自动登录，下图为网站登录界面。1、运行环境操作系统：Windows10python版本：python3.72、需要的python第三方库1、selenium安装：pip install seleniumseleniu...
复制链接

扫一扫