selenium+pytesseract 验证码登录【半成品,有待改进】

本文展示了如何结合selenium和pytesseract库来实现网页验证码的识别。通过定位验证码元素,截图并裁剪出验证码部分,再进行图像处理增强,最后使用pytesseract读取文字。这是一个验证码识别的基础流程,但还有待进一步优化。
摘要由CSDN通过智能技术生成
import time
from selenium import webdriver
from PIL import Image, ImageEnhance
import pytesseract  
driver = webdriver.Firefox()
driver.get('http://*****')

#让页面加载
time.sleep(2)

#找到第一个iframe
iframe =driver.find_element_by_xpath("//html/body/table/tbody/tr[3]/td[2]/div[1]/table/tbody/tr/td/iframe")

x=iframe.location['x']
y=iframe.location['y']
#print(x,y)

#切换到iframe
driver.switch_to_frame(iframe)

inputText=driver.find_element_by_id('txt_sdertfgsadscxcadsads')
inputText.click()
time.sleep(2)
cpatcha=driver.find_element_by_id('imgCode')

#截取整个页面
driver.save_screenshot('D://page.png')


#获取验证码图片的x,y坐标,以及自身宽度和高度
left = x+cpatcha.location['x']
top =y+cpatcha.location['y']
right =x+cpatcha.location['x'] + cpatcha.size['width']
bottom = y+cpatcha.location['y'] + cpatcha.size['heig
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值