import time
from selenium import webdriver
from PIL import Image, ImageEnhance
import pytesseract
driver = webdriver.Firefox()
driver.get('http://*****')
#让页面加载
time.sleep(2)
#找到第一个iframe
iframe =driver.find_element_by_xpath("//html/body/table/tbody/tr[3]/td[2]/div[1]/table/tbody/tr/td/iframe")
x=iframe.location['x']
y=iframe.location['y']
#print(x,y)
#切换到iframe
driver.switch_to_frame(iframe)
inputText=driver.find_element_by_id('txt_sdertfgsadscxcadsads')
inputText.click()
time.sleep(2)
cpatcha=driver.find_element_by_id('imgCode')
#截取整个页面
driver.save_screenshot('D://page.png')
#获取验证码图片的x,y坐标,以及自身宽度和高度
left = x+cpatcha.location['x']
top =y+cpatcha.location['y']
right =x+cpatcha.location['x'] + cpatcha.size['width']
bottom = y+cpatcha.location['y'] + cpatcha.size['heig
selenium+pytesseract 验证码登录【半成品,有待改进】
最新推荐文章于 2022-09-02 09:27:31 发布
本文展示了如何结合selenium和pytesseract库来实现网页验证码的识别。通过定位验证码元素,截图并裁剪出验证码部分,再进行图像处理增强,最后使用pytesseract读取文字。这是一个验证码识别的基础流程,但还有待进一步优化。
摘要由CSDN通过智能技术生成