涉及到的知识点:
- selenium自动化测试工具的使用(基本的点击,输入文本,执行动作链)
- 12306图片验证码的破解(点选类验证码)
实现的效果:
案例代码:
from selenium import webdriver
from selenium.webdriver import ActionChains
import base64
import requests
import re
import time
def login():
username = 用户名
password = 密码
driver.get('https://kyfw.12306.cn/otn/resources/login.html')
driver.maximize_window()
#driver.set_window_size(1600,900)
# 隐式等待
driver.implicitly_wait(10) # 10秒钟内只要找到了元素就开始执行,10秒钟后未找到,就超时;
# 使用隐式等待的目的是确保页面元素全部加载完毕以后,再进行后面代码的运行
"""
implicitly_wait():隐式等待
当使用了隐式等待执行测试的时候,如果 WebDriver没有在 DOM中找到元素,将继续等待,超出设定时间后则抛出找不到元素的异常
换句话说,当查找元素或元素并没有立即出现的时候,隐式等待将等待一段时间再查找 DOM,默认的时间是0
一旦设置了隐式等待,则它存在整个 WebDriver 对象实例的声明周期中,隐式的等到会让一个正常响应的应用的测试变慢,
它将会在寻找每个元素的时候都进行等待,这样会增加整个测试执行的时间。
"""
driver.find_element_by_xpath('/html/body/div[2]/div[2]/ul/li[2]/a').click()
driver.find_element_by_xpath('//*[@id="J-userName"]').send_keys(username)
driver.find_element_by_xpath('//*[@id="J-password"]').send_keys(password)
# 图片验证码 是一个base64字符串
img_url = driver.find_element_by_xpath('//*[@id="J-loginImg"]').get_attribute('src')
"""
base64是 将图片二进制的数据转换成了字符串的形式
优点:1.可以在网速不好的时候优先于内容加载(它放在了css样式里,渲染的时候比请求一个图片的链接地址要快)
2.减少了http请求
3.没有请求,减少了服务器的负担
"""
print('验证码的url',img_url)
get_image(img_url)
ysm_result = yzm_resolve()
# 点击输入验证码
click_yzm_result(ysm_result)
# 点击登录
driver.find_element_by_xpath('//*[@id="J-login"]').click()
# 再次进行隐式等待
driver.implicitly_wait(10)
def get_image(img_url):
"""base64图片的解码,保存图片"""
# 数据的分割
base64_url = img_url.split(',')[1]
# 把base64字符串转化成二进制形式
img_data = base64.b64decode(base64_url)
with open('yzm.jpg',mode='wb') as f:
f.write(img_data)
def yzm_resolve():
"""借助第三方接口识别验证码"""
# http://littlebigluo.qicp.net:47720/
img_data = open('yzm.jpg',mode="rb")
file = {'pic_xxfile':img_data}
url = 'http://littlebigluo.qicp.net:47720/'
resp = requests.post(url=url,files=file)
result = []
for i in re.findall('<B>(.*?)</B>',resp.text)[0].split(' '):
result.append(int(i))
print("识别结果:",result)
img_data.close()
return result
def click_yzm_result(result):
"""控制鼠标点击验证码的结果 (动作链)"""
# ActionChains
img_element = driver.find_element_by_xpath('//*[@id="J-loginImg"]')
print("初始化动作链中...")
action = ActionChains(driver)
for i in result:
# 8个图片区域的像素点,这个根据自己电脑上的实际情况去写,利用截图工具大致算一算(以图片中心为0,0点)
# MAP = [[-105,-20], [-35,-20], [40,-20], [110,-20], [-105,50], [-35,50], [40,50], [110,50]]
MAP = [[-135,-45], [-45,-45], [45,-45], [135,-45],
[-135,45], [-45,45], [45,45], [135,45]]
# 1.2.3.4.5.6.7.8
action.move_to_element(img_element).move_by_offset(MAP[i-1][0],MAP[i-1][1]).click()
# 模拟人的操作,增加一定的延时
time.sleep(1) # 休眠1秒钟
# 执行动作链
print("执行动作链")
action.perform()
time.sleep(1)
if __name__ == '__main__':
driver = webdriver.Chrome()
login()