selenium项目实战（三）：实现网页验证码识别

爱学习的包青蛙

已于 2022-03-10 14:06:10 修改

阅读量4.6k

点赞数

分类专栏： python自动化测试文章标签： selenium python

于 2022-03-10 08:52:20 首次发布

本文链接：https://blog.csdn.net/m0_52641463/article/details/123344391

版权

步骤

截屏整个页面
获得验证码坐标数据
根据坐标数据抠图
使用pytesseract模块进行验证

问题：

利用save_screenshot和PIL模块的crop截取验证码区域时，截取不到正确的二维码图片。
**原因：**坐标定位不准确，电脑默认缩放的值为125%。将其改为100%即可正确定位；或者将对应的左上角坐标x、y，图片宽高width、height分别乘以对应的比例1.25，同样可以准确截取图片。
图片验证码识别方案：
1. 使用pytesseract库：该方法适合各种变形较少的验证码，对于扭曲的字母和数字识别率大大降低。
2. 调用showapi 提供的图片验证码识别
3. 自己训练机器学习模型实现验证码识别。

import pickle
import string
import time
from lib.ShowapiRequest import ShowapiRequest
from PIL import Image
import os
import random
import base64


def get_code(driver, id):
    # 获取验证码图片
    t = time.time()
    path = os.path.dirname(os.path.dirname(__file__

最低0.47元/天解锁文章

爱学习的包青蛙

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
selenium项目实战（三）：实现网页验证码识别

步骤截屏整个页面获得验证码坐标数据根据坐标数据抠图使用pytesseract模块进行验证问题：利用save_screenshot和PIL模块的crop截取验证码区域时，截取不到正确的二维码图片。**原因：**坐标定位不准确，电脑默认缩放的值为125%。将其改为100%即可正确定位；或者将对应的左上角坐标x、y，图片宽高width、height分别乘以对应的比例1.25，同样可以准确截取图片。图片验证码识别方案：使用pytesseract库：该方法适合各种变形较少的验证码，对
复制链接

扫一扫