selenium的应用之——12306模拟登陆

最新推荐文章于 2022-04-13 14:44:38 发布

弹吉他的羊驼

最新推荐文章于 2022-04-13 14:44:38 发布

阅读量152

点赞数

分类专栏： selenium 爬虫文章标签： python selenium 爬虫

本文链接：https://blog.csdn.net/qq_43278562/article/details/115470198

版权

爬虫同时被 2 个专栏收录

26 篇文章 1 订阅

订阅专栏

selenium

5 篇文章 0 订阅

订阅专栏

在使用selenium进行12306的模拟登陆时，遇到了很多让人头疼的问题，最终在借鉴其他博主的方案之下，终于实现了12306的模拟登陆。

思路：

从网站首页开始，通过调用两次click（）跳转到包含有验证码的登录页面。
然后将验证码图片下载下来，通过超级鹰进行识别并返回验证码所在的坐标。
对这些坐标进行处理，通过selenium自动化点击验证码所要求的坐标。
输入用户名和密码
点击登录按钮

超级鹰是一个自助帮你识别验证码并返回给你相关内容的一个平台。

我的源代码如下：

import requests
from hashlib import md5
# 这个类的内容都是超级鹰提供的测试代码，看不懂也没关系
class Chaojiying_Client(object):

    def __init__(self, username, password, soft_id):
        self.username = username
        password =  password.encode('utf8')
        self.password = md5(password).hexdigest()
        self.soft_id = soft_id
        self.base_params = {
            'user': self.username,
            'pass2': self.password,
            'softid': self.soft_id,
        }
        self.headers = {
            'Connection': 'Keep-Alive',
            'User-Agent': 'Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0)',
        }

    def PostPic(self, im, codetype):
        """
        im: 图片字节
        codetype: 题目类型 参考 http://www.chaojiying.com/price.html
        """
        params = {
            'codetype': codetype,
        }
        params.update(self.base_params)
        files = {'userfile': ('ccc.jpg', im)}
        r = requests.post('http://upload.chaojiying.net/Upload/Processing.php', data=params, files=files, headers=self.headers)
        return r.json()

    def ReportError(self, im_id):
        """
        im_id:报错题目的图片ID
        """
        params = {
            'id': im_id,
        }
        params.update(self.base_params)
        r = requests.post('http://upload.chaojiying.net/Upload/ReportError.php', data=params, headers=self.headers)
        return r.json()

# 使用selenium
from selenium import webdriver
import time
from selenium.webdriver import ActionChains
from PIL import Image
bro = webdriver.Chrome(executable_path='./chromedriver.exe')
# 注意一定要将屏幕最大化，否则找不到验证码图片
bro.maximize_window()
# 访问网页
bro.get('https://www.12306.cn/index/')
time.sleep(1)

# 因为是从首页请求的，所以会有两个点击动作
bro.find_element_by_xpath('//*[@id="J-header-login"]/a[1]').click()
time.sleep(1)

bro.find_element_by_xpath('/html/body/div[2]/div[2]/ul/li[2]/a').click()
time.sleep(1)

# 定位到验证码位置并将其保存
img = bro.find_element_by_xpath('//*[@id="J-loginImg"]')
#通过screenshot进行保存
img.screenshot('code.png')

#调用超级鹰
chaojiying = Chaojiying_Client('超级鹰用户名', '超级鹰密码', '软件id')
im = open('code.png', 'rb').read()
result = chaojiying.PostPic(im, 9004)['pic_str']
print(result)

# 处理坐标
# 这一块处理坐标是参考一个博主的处理方法，文末会放置链接。
all_list = []
if '|' in result:
    list = result.split('|')
    for i in range(len(list)):
        x_y = []
        x = int(list[i].split(',')[0])
        y = int(list[i].split(',')[1])
        x_y.append(x)
        x_y.append(y)
        all_list.append(x_y)
else:
    x_y = []
    x = int(result.split(',')[0])
    y = int(result.split(',')[1])
    x_y.append(x)
    x_y.append(y)
    all_list.append(x_y)
print(all_list)

# 处理好的坐标进行循环 进行点击
for l in all_list:
    x = l[0]
    y = l[1]
    ActionChains(bro).move_to_element_with_offset(img,x,y).click().perform()
    time.sleep(1)

# 图片点击好以后，向表单内发送账户密码
bro.find_element_by_xpath('//*[@id="J-userName"]').send_keys('12306账户')
bro.find_element_by_xpath('//*[@id="J-password"]').send_keys('12306密码')

bro.find_element_by_xpath('//*[@id="J-login"]').click()
time.sleep(5)
bro.quit()

处理坐标参考：
mushroom27，这个博主处理坐标的方法很巧妙，值得学习！！

弹吉他的羊驼

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
selenium的应用之——12306模拟登陆

在使用selenium进行12306的模拟登陆时，遇到了很多让人头疼的问题，最终在借鉴其他博主的方案之下，终于实现了12306的模拟登陆。思路：从网站首页开始，通过调用两次click（）跳转到包含有验证码的登录页面。然后将验证码图片下载下来，通过超级鹰进行识别并返回验证码所在的坐标。对这些坐标进行处理，通过selenium自动化点击验证码所要求的坐标。输入用户名和密码点击登录按钮超级鹰是一个自助帮你识别验证码并返回给你相关内容的一个平台。我的源代码如下：import requests
复制链接

扫一扫