在使用selenium进行12306的模拟登陆时,遇到了很多让人头疼的问题,最终在借鉴其他博主的方案之下,终于实现了12306的模拟登陆。
思路:
- 从网站首页开始,通过调用两次click()跳转到包含有验证码的登录页面。
- 然后将验证码图片下载下来,通过超级鹰进行识别并返回验证码所在的坐标。
- 对这些坐标进行处理,通过selenium自动化点击验证码所要求的坐标。
- 输入用户名和密码
- 点击登录按钮
超级鹰是一个自助帮你识别验证码并返回给你相关内容的一个平台。
我的源代码如下:
import requests
from hashlib import md5
# 这个类的内容都是超级鹰提供的测试代码,看不懂也没关系
class Chaojiying_Client(object):
def __init__(self, username, password, soft_id):
self.username = username
password = password.encode('utf8')
self.password = md5(password).hexdigest()
self.soft_id = soft_id
self.base_params = {
'user': self.username,
'pass2': self.password,
'softid': self.soft_id,
}
self.headers = {
'Connection': 'Keep-Alive',
'User-Agent': 'Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0)',
}
def PostPic(self, im, codetype):
"""
im: 图片字节
codetype: 题目类型 参考 http://www.chaojiying.com/price.html
"""
params = {
'codetype': codetype,
}
params.update(self.base_params)
files = {'userfile': ('ccc.jpg', im)}
r = requests.post('http://upload.chaojiying.net/Upload/Processing.php', data=params, files=files, headers=self.headers)
return r.json()
def ReportError(self, im_id):
"""
im_id:报错题目的图片ID
"""
params = {
'id': im_id,
}
params.update(self.base_params)
r = requests.post('http://upload.chaojiying.net/Upload/ReportError.php', data=params, headers=self.headers)
return r.json()
# 使用selenium
from selenium import webdriver
import time
from selenium.webdriver import ActionChains
from PIL import Image
bro = webdriver.Chrome(executable_path='./chromedriver.exe')
# 注意一定要将屏幕最大化,否则找不到验证码图片
bro.maximize_window()
# 访问网页
bro.get('https://www.12306.cn/index/')
time.sleep(1)
# 因为是从首页请求的,所以会有两个点击动作
bro.find_element_by_xpath('//*[@id="J-header-login"]/a[1]').click()
time.sleep(1)
bro.find_element_by_xpath('/html/body/div[2]/div[2]/ul/li[2]/a').click()
time.sleep(1)
# 定位到验证码位置并将其保存
img = bro.find_element_by_xpath('//*[@id="J-loginImg"]')
#通过screenshot进行保存
img.screenshot('code.png')
#调用超级鹰
chaojiying = Chaojiying_Client('超级鹰用户名', '超级鹰密码', '软件id')
im = open('code.png', 'rb').read()
result = chaojiying.PostPic(im, 9004)['pic_str']
print(result)
# 处理坐标
# 这一块处理坐标是参考一个博主的处理方法,文末会放置链接。
all_list = []
if '|' in result:
list = result.split('|')
for i in range(len(list)):
x_y = []
x = int(list[i].split(',')[0])
y = int(list[i].split(',')[1])
x_y.append(x)
x_y.append(y)
all_list.append(x_y)
else:
x_y = []
x = int(result.split(',')[0])
y = int(result.split(',')[1])
x_y.append(x)
x_y.append(y)
all_list.append(x_y)
print(all_list)
# 处理好的坐标进行循环 进行点击
for l in all_list:
x = l[0]
y = l[1]
ActionChains(bro).move_to_element_with_offset(img,x,y).click().perform()
time.sleep(1)
# 图片点击好以后,向表单内发送账户密码
bro.find_element_by_xpath('//*[@id="J-userName"]').send_keys('12306账户')
bro.find_element_by_xpath('//*[@id="J-password"]').send_keys('12306密码')
bro.find_element_by_xpath('//*[@id="J-login"]').click()
time.sleep(5)
bro.quit()
处理坐标参考:
mushroom27,这个博主处理坐标的方法很巧妙,值得学习!!