使用ddddocr实现文字验证码和滑块验证码

WRH一坨

已于 2024-05-20 10:06:27 修改

阅读量4.2k

点赞数 16

文章标签： python 自动化 selenium

于 2023-12-28 14:40:50 首次发布

本文链接：https://blog.csdn.net/weixin_43985642/article/details/135267930

版权

文字图片验证码识别

DDDDOCR YYDS！！！
ddddocr的数字英文识别准确率大概有个百分之九十，我用了挺久的，目前还没有遇到ddddocr识别准确率很低的数字英文验证码。

import ddddocr
# 识别验证码
def identifying_code(path):
    # show_ad广告
    ocr = ddddocr.DdddOcr(show_ad=False)
    with open(path, 'rb') as f:
        img_bytes = f.read()
    res = ocr.classification(img_bytes)
    print(res)
    return res

if __name__ == '__main__':
    result = identifying_code(r"C:\Users\Desktop\identifyingCode.jfif")

path放的是验证码图片的路径，会返回一个字符串，不过为了准确率，建议这边最好加一些判断，比如你的网站验证码是五个字符组成，如12ABC这样，就判断下字符串长度是否是5，如果不是直接刷新重新识别。

以下为滑块验证码代码

'''----------滑块验证码----------'''
import os
import base64
import time
import requests
from PIL import Image
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver import ActionChains
from io import BytesIO
import traceback
import ddddocr
# 滑块图片路径
slider_path = r"C:\Users\Desktop\shuo\slider.png"
# 背景图片路径
background_path = r"C:\Users\Desktop\shuo\background.png"


def login(webpath):
    """geetest滑块验证码"""
    driver = webdriver.Chrome()
    driver.get(webpath)
    time.sleep(2)
    # 最大化窗口
    driver.maximize_window()
    time.sleep(2)
    driver.find_element(By.XPATH,
                        '/html/body/div[3]/div/div[4]/div[1]/form/div[2]/div/div/input')

最低0.47元/天解锁文章