文字图片验证码识别
DDDDOCR YYDS!!!
ddddocr的数字英文识别准确率大概有个百分之九十,我用了挺久的,目前还没有遇到ddddocr识别准确率很低的数字英文验证码。
import ddddocr
# 识别验证码
def identifying_code(path):
# show_ad广告
ocr = ddddocr.DdddOcr(show_ad=False)
with open(path, 'rb') as f:
img_bytes = f.read()
res = ocr.classification(img_bytes)
print(res)
return res
if __name__ == '__main__':
result = identifying_code(r"C:\Users\Desktop\identifyingCode.jfif")
path放的是验证码图片的路径,会返回一个字符串,不过为了准确率,建议这边最好加一些判断,比如你的网站验证码是五个字符组成,如12ABC这样,就判断下字符串长度是否是5,如果不是直接刷新重新识别。
以下为滑块验证码代码
'''----------滑块验证码----------'''
import os
import base64
import time
import requests
from PIL import Image
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver import ActionChains
from io import BytesIO
import traceback
import ddddocr
# 滑块图片路径
slider_path = r"C:\Users\Desktop\shuo\slider.png"
# 背景图片路径
background_path = r"C:\Users\Desktop\shuo\background.png"
def login(webpath):
"""geetest滑块验证码"""
driver = webdriver.Chrome()
driver.get(webpath)
time.sleep(2)
# 最大化窗口
driver.maximize_window()
time.sleep(2)
driver.find_element(By.XPATH,
'/html/body/div[3]/div/div[4]/div[1]/form/div[2]/div/div/input')