Python爬虫实战之12306抢票


前言

提示:用python实现简单的12306余票查询


提示:以下是本篇文章正文内容,下面案例可供参考

一、爬虫是什么?

爬虫一般指网络爬虫。网络爬虫(又称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。

工具:pycharm+python3.7

二、使用步骤

1.引入库

代码如下(示例):

# -*- coding:utf-8 -*-
"""
@author 恒仔仔
"""
from splinter.browser import Browser
from time import sleep
import traceback
import time, sys
import os

2.爬虫代码

代码如下(示例):

class HuoChe(object):
    """docstring for Train"""
    driver_name = ''
    executable_path = ''
    # 用户名 密码
    username = u"12306帐户名"
    passwd = u"12306密码"
    # cookies值自己找
    # 天津%u5929%u6D25%2CTJP 南昌%u5357%u660C%2CNCG 桂林%u6842%u6797%2CGLZ
    starts = u"%u5929%u6D25%2CTJP"
    ends = u"%u5357%u660C%2CNCG"
    # 时间格式2020-10-09
    dtime = u"2020-10-09"
    # 车次,选择第几趟,0则从上之下依次点击
    order = 0
    ###乘客姓名
    users = [u'乘客名']
    ##席位
    xb = u"二等座"
    pz = u"成人票"
    """网址"""
    # 12306查询URL
    ticket_url = "https://kyfw.12306.cn/otn/leftTicket/init"
    # 12306登录URL
    login_url = "https://kyfw.12306.cn/otn/login/init"
    # 我的12306URL
    initmy_url = "https://kyfw.12306.cn/otn/index/initMy12306"
    # 购票URL
    buy = "https://kyfw.12306.cn/otn/confirmPassenger/initDc"
    login_url = 'https://kyfw.12306.cn/otn/login/init'

    def __init__(self):
        self.driver_name = 'chrome'
        self.executable_path = os.getcwd() + '/chromedriver'
        print("Welcome To Use The Tool")

    def login(self):
        self.driver.visit(self.login_url)
        # 填充密码
        self.driver.fill("loginUserDTO.user_name", self.username)
        self.driver.fill("userDTO.password", self.passwd)
        print("等待验证码,自行输入....")
        while True:
            if self.driver.url != self.initmy_url:
                sleep(1)
            else:
                break

    def start(self):
        self.driver = Browser(driver_name=self.driver_name, executable_path=self.executable_path)
        self.driver.driver.set_window_size(1400, 1000)
        self.login()
        self.driver.visit(self.ticket_url)
        try:
            print("购票页面开始....")
            # 加载查询信息
            self.driver.cookies.add({"_jc_save_fromStation": self.starts})
            self.driver.cookies.add({"_jc_save_toStation": self.ends})
            self.driver.cookies.add({"_jc_save_fromDate": self.dtime})

            self.driver.reload()

            count = 0
            if self.order != 0:
                while self.driver.url == self.ticket_url:
                    self.driver.find_bytext(u"查询").click()
                    count += 1
                    print("循环点击查询.... 第 %s 次" % count)
                    try:
                        self.driver.find_by_text(u'预订')[self.order - 1].click()
                    except Exception as e:
                        print(e)
                        print("还没开始预订")
                        continue
            else:
                while self.driver.url == self.ticket_url:
                    self.driver.find_by_text(u"查询").click()
                    count += 1
                    print("循环点击查询.... 第 %s 次" % count)
                         try:
                        for i in self.driver.find_by_text(u"预订"):
                            i.click()
                            sleep(1)
                    except Exception as e:
                        print(e)
                        print("还没开始预订 %s " % count)
                        continue
            print("开始预订....")
            sleep(1)
            print("开始选择用户....")
            for user in self.users:
                self.driver.find_by_text(user).last.click()
            print("提交订单....")
            sleep(1)
               self.driver.find_by_id('submitOrder_id').click()
            print("开始选座...")
            sleep(1.5)
            print("确认选座....")
            self.driver.find_by_text('qr_submit_id').click()

        except Exception as e:
            print(e)

3.城市编码

12306上的这些城市名与编码一一对应,在浏览器中打开开发者工具(F12)查看详细内容。

cities = {
    '天津': '%u5929%u6D25%2CTJP',
    '南昌': '%u5357%u660C%2CNCG',
    '桂林': '%u6842%u6797%2CGLZ'
}

4.主程序

if __name__ == "__main__":
    train = HuoChe()
    train.starts = cities[sys.argv[1]]
    train.ends = cities[sys.argv[2]]
    train.dtime = sys.argv[3]
    train.start()

运行代码的脚本命令
python trainticket.py 天津 南昌 2020-10-09


总结

提示:这里对文章进行总结:
例如:以上就是今天要讲的内容,本文仅仅简单介绍了python爬虫的使用。

  • 13
    点赞
  • 80
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值