Python之12306余票查询

简单的Python学习,用Python完成一个12306余票查询~

Python之12306余票查询

参考资料来自Python 实现火车票查询工具

需要用到的第三方库
  • requests,使用 Python 访问 HTTP 资源的必备库。

  • docopt,Python3 命令行参数解析工具。

  • prettytable, 格式化信息打印工具,能让你像 MySQL 那样打印数据。

效果图

屏幕快照 2018-10-05 下午5.12.19.png

分析12306接口请求

屏幕快照 2018-10-05 下午8.05.36.png

这是一个标准的12306查询余票界面,本次Demo使用的浏览器是Safari,首先打开Safari的开发选项屏幕快照 2018-10-05 下午8.07.18.png

屏幕快照 2018-10-05 下午8.08.58.png

在网页检查器中我们刷新网页,可以观察到下面这个接口~
屏幕快照 2018-10-05 下午8.10.08.png

单独复制url打开就能发现这就是12306余票数据请求接口,分析一下这个接口的类型是Get,请求参数是

  • leftTicketDTO.train_date: 2018-10-30

  • leftTicketDTO.from_station: BJP

  • leftTicketDTO.to_station: LYF

  • purpose_codes: ADULT

hoho~,万里长征第一步走的还是比较顺利的,下面就用我们的python程序来请求这个接口看看~

Requests请求接口

import requests

url = 'https://kyfw.12306.cn/otn/leftTicket/queryA?leftTicketDTO.train_date=2018-10-30&leftTicketDTO.from_station=BJP&leftTicketDTO.to_station=LYF&purpose_codes=ADULT'
r= requests.get(url)
print(r.json())

关于requests库,我刚接触python觉得应该是现在网络交互中必选库吧,上述代码就请求12306的接口并且输出结果为json

{
    "data":{
        "flag":"1",
        "map":{
            "BXP":"北京西",
            "GLF":"关林",
            "LLF":"洛阳龙门",
            "LYF":"洛阳"
        },
        "result":Array[18]
    },
    "httpstatus":200,
    "messages":"",
    "status":true
}

数据结构如上,我们只需要result中的结果就ok,python也可以很方便的解析json这一点我觉得比java舒服一些。

r= requests.get(url)
print(r.json()['data']['result'])

我们现在已经有了数据,接下来则是把我们转换过的结果显示出来,万里长征第二步~

PrettyTable库

PrettyTable 是python中的一个第三方库,可用来生成美观的ASCII格式的表格,十分实用。以下为官方介绍:

A simple Python library for easily displaying tabular data in a visually appealing ASCII table format.PrettyTable is a simple Python library designed to make it quick and easy to represent tabular data in visually appealing ASCII tables. It was inspired by the ASCII tables used in the PostgreSQL shell psql. PrettyTable allows for selection of which columns are to be printed, independent alignment of columns (left or right justified or centred) and printing of “sub-tables” by specifying a row range.

使用方法也是非常简单,先写个小小的Demo

pt = PrettyTable()
pt.field_names=['测试1','测试2','测试3','测试4','测试5']
pt.add_row(['测试结果1','测试结果2', '测试结果3', '测试结果4','测试结果5'])
print(pt)

+-----------+-----------+-----------+-----------+-----------+
|   测试1   |   测试2   |   测试3   |   测试4   |   测试5   |
+-----------+-----------+-----------+-----------+-----------+
| 测试结果1 | 测试结果2 | 测试结果3 | 测试结果4 | 测试结果5 |
+-----------+-----------+-----------+-----------+-----------+

通过field_names设置元数据(其实并不知道怎么形容。。。

然后不断的add_row添加行,那么我们的12306也就可以这样写啦,

# coding: utf-8

import requests, datetime
from prettytable import PrettyTable


def _get_time(from_time, trains_time):
    try:
        time1 = datetime.datetime.strptime(from_time, "%H:%M")
        time2 = datetime.datetime.strptime(trains_time, "%H:%M")
    except ValueError as e:
        return '异常时间啦'
    hour = 0
    if time1.minute + time2.minute >= 60:
        hour = 1

    if time1.hour + time2.hour + hour > 24:
        return "次日到达"
    else:
        return "今日到达"


def _get_seat_count(count):
    if not str(count).strip():
        return '--'
    else:
        return count


url = 'https://kyfw.12306.cn/otn/leftTicket/queryA?leftTicketDTO.train_date=2018-10-30&leftTicketDTO.from_station=SHH&leftTicketDTO.to_station=LYF&purpose_codes=ADULT'
r = requests.get(url)
results = r.json()['data']['result']

header = '车次 车站 时间 历时 商务座特等座 一等座 二等座 高级软卧 软卧 动卧 硬卧'.split()
pt = PrettyTable()
pt._set_field_names(header)
for raw_train in results:
    trains_info = str(raw_train).split('|')
    from_station = trains_info[6]
    to_station = trains_info[7]
    from_time = trains_info[8]
    to_time = trains_info[9]
    trains_time = trains_info[10]
    pt.add_row([trains_info[3], from_station + "\n" + to_station, from_time + "\n" + to_time,
                trains_time + "\n" + _get_time(from_time, trains_time),
                _get_seat_count(trains_info[32]), _get_seat_count(trains_info[31]),
                _get_seat_count(trains_info[30]), _get_seat_count(trains_info[21]),
                _get_seat_count(trains_info[23]), _get_seat_count(trains_info[33]),
                _get_seat_count(trains_info[28])])

print(pt)


+-------+----------+-------+----------+--------------+--------+--------+----------+------+------+------+
|  车次 |   车站   |  时间 |   历时   | 商务座特等座 | 一等座 | 二等座 | 高级软卧 | 软卧 | 动卧 | 硬卧 |
+-------+----------+-------+----------+--------------+--------+--------+----------+------+------+------+
|  G427 |  北京西  | 06:20 |  03:26   |      11      |   2    |   有   |    --    |  --  |  --  |  --  |
|       | 洛阳龙门 | 09:46 | 今日到达 |              |        |        |          |      |      |      |
|  G651 |  北京西  | 06:58 |  04:07   |      有      |   有   |   有   |    --    |  --  |  --  |  --  |
|       | 洛阳龙门 | 11:05 | 今日到达 |              |        |        |          |      |      |      |
|  K269 |  北京西  | 07:00 |  10:47   |      --      |   --   |   --   |    --    |  有  |  --  |  有  |
|       |   洛阳   | 17:47 | 今日到达 |              |        |        |          |      |      |      |
|  K507 |  北京西  | 07:12 |  10:05   |      --      |   --   |   --   |    --    |  10  |  --  |  有  |
|       |   洛阳   | 17:17 | 今日到达 |              |        |        |          |      |      |      |
|  K817 |  北京西  | 08:01 |  11:11   |      --      |   --   |   --   |    --    |  9   |  --  |  有  |
|       |   洛阳   | 19:12 | 今日到达 |              |        |        |          |      |      |      |
|  G671 |  北京西  | 08:16 |  04:12   |      9       |   有   |   有   |    --    |  --  |  --  |  --  |
|       | 洛阳龙门 | 12:28 | 今日到达 |              |        |        |          |      |      |      |
|  G307 |  北京西  | 09:38 |  04:09   |      8       |   有   |   有   |    --    |  --  |  --  |  --  |
|       | 洛阳龙门 | 13:47 | 今日到达 |              |        |        |          |      |      |      |
|  G655 |  北京西  | 09:43 |  04:17   |      19      |   有   |   有   |    --    |  --  |  --  |  --  |
|       | 洛阳龙门 | 14:00 | 今日到达 |              |        |        |          |      |      |      |
|  G429 |  北京西  | 10:45 |  04:01   |      7       |   2    |   有   |    --    |  --  |  --  |  --  |
|       | 洛阳龙门 | 14:46 | 今日到达 |              |        |        |          |      |      |      |
|  K267 |  北京西  | 13:22 |  11:23   |      --      |   --   |   --   |    --    |  无  |  --  |  有  |
|       |   关林   | 00:45 | 今日到达 |              |        |        |          |      |      |      |
|  G673 |  北京西  | 14:35 |  04:17   |      8       |   有   |   有   |    --    |  --  |  --  |  --  |
|       | 洛阳龙门 | 18:52 | 今日到达 |              |        |        |          |      |      |      |
|  G661 |  北京西  | 14:48 |  04:09   |      3       |   无   |   有   |    --    |  --  |  --  |  --  |
|       | 洛阳龙门 | 18:57 | 今日到达 |              |        |        |          |      |      |      |
|  G663 |  北京西  | 15:45 |  03:54   |      8       |   有   |   有   |    --    |  --  |  --  |  --  |
|       | 洛阳龙门 | 19:39 | 今日到达 |              |        |        |          |      |      |      |
|  T55  |  北京西  | 15:50 |  08:47   |      --      |   --   |   --   |    --    |  3   |  --  |  2   |
|       |   洛阳   | 00:37 | 今日到达 |              |        |        |          |      |      |      |
|  Z75  |  北京西  | 15:57 |  07:05   |      --      |   --   |   --   |    --    |  2   |  --  |  无  |
|       |   洛阳   | 23:02 | 今日到达 |              |        |        |          |      |      |      |
|  G665 |  北京西  | 16:00 |  04:11   |      7       |   有   |   有   |    --    |  --  |  --  |  --  |
|       | 洛阳龙门 | 20:11 | 今日到达 |              |        |        |          |      |      |      |
|  T231 |  北京西  | 18:50 |  08:03   |      --      |   --   |   --   |    --    |  无  |  --  |  18  |
|       |   洛阳   | 02:53 | 次日到达 |              |        |        |          |      |      |      |
| K1363 |  北京西  | 22:06 |  09:38   |      --      |   --   |   --   |    --    |  无  |  --  |  有  |
|       |   洛阳   | 07:44 | 次日到达 |              |        |        |          |      |      |      |
+-------+----------+-------+----------+--------------+--------+--------+----------+------+------+------+

12306的接口格式我个人觉得有点非人类…本例用的组合方法可能并不是最优方法,欢迎大家提供更好的方法~,万里长征三步走完啦,最后一步就是如何动态的调整出发地和目的地。

docopt

一个参数解析库,可以看下Python 参数解析库 docopt 简单使用图文教程。

利用这个库的便利性我们可以很方便的提取出想要的参数信息,

"""命令行火车票查看器

Usage:
    tickets [-gdtkz] <from> <to> <date>

Options:
    -h,--help   显示帮助菜单
    -g          高铁
    -d          动车
    -t          特快
    -k          快速
    -z          直达

Example:
    tickets 北京 上海 2016-10-10
    tickets -dg 成都 南京 2016-10-10
"""

def cil():
    """command-line interface"""
    arguments = docopt(__doc__)
    from_station = arguments['<from>']
    to_station = arguments['<to>']
    date = arguments['<date>']
    print("from_station:" + from_station + "\nto_station:" + to_station + "\ndate:" + date)


if __name__ == '__main__':
    cil()
    
python tickets_test.py -dg 上海 洛阳 2018-10-31

from_station:上海
to_station:洛阳
date:2018-10-31

这里其实还有一个问题就是我们提取出来的都是中文,而12306接口需要的是缩写,这里我们可以通过12306的另一个接口解决~

import re, requests
from pprint import pprint
url = 'https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.9069'
response = requests.get(url)
stations = re.findall(u'([\u4e00-\u9fa5]+)\|([A-Z]+)', response.text)
pprint(dict(stations), indent=4)

python parse_station.py > stations.py


stations = {'一间堡': 'YJT',
            '一面坡': 'YPB',
            '一面山': 'YST',
            '七台河': 'QTB',
            '七甸': 'QDM',
            '七营': 'QYJ',
            '七里河': 'QLD',
            '万乐': 'WEB',
            '万发屯': 'WFB',
            '万宁': 'WNQ',
            '万州': 'WYW',
            '万州北': 'WZE',
            '万年': 'WWG',
            '万源': 'WYY',
            '三义井': 'OYD',
            '三井子': 'OJT',
            '三亚': 'SEQ',
            '三元区': 'SMS',
            '三关口': 'OKJ',
            '三十家': 'SRD',
            '三十里堡': 'SST',
            '三原': 'SAY',
            '三合庄': 'SVP',
            .....
            }

所有的条件已经集齐,我们走最后一步吧~

汽车人合体

def cil():
    """command-line interface"""
    arguments = docopt(__doc__)
    from_station = stations.get(arguments['<from>'])
    to_station = stations.get(arguments['<to>'])
    date = arguments['<date>']
    print("from_station:" + from_station + "\nto_station:" + to_station)
    # 构建URL
    url = 'https://kyfw.12306.cn/otn/leftTicket/queryA?leftTicketDTO.train_date={}&leftTicketDTO.from_station={}&leftTicketDTO.to_station={}&purpose_codes=ADULT'.format(
        date, from_station, to_station
    )
    r = requests.get(url, verify=False)
    results = r.json()['data']['result']
    header = '车次 车站 时间 历时 商务座特等座 一等座 二等座 高级软卧 软卧 动卧 硬卧'.split()
    pt = PrettyTable()
    pt._set_field_names(header)
    for raw_train in results:
        trains_info = str(raw_train).split('|')
        from_station = trains_info[6]
        to_station = trains_info[7]
        from_time = trains_info[8]
        to_time = trains_info[9]
        trains_time = trains_info[10]
        pt.add_row([trains_info[3], from_station + "\n" + to_station, from_time + "\n" + to_time,
                    trains_time + "\n" + _get_time(from_time, trains_time),
                    _get_seat_count(trains_info[32]), _get_seat_count(trains_info[31]),
                    _get_seat_count(trains_info[30]), _get_seat_count(trains_info[21]),
                    _get_seat_count(trains_info[23]), _get_seat_count(trains_info[33]),
                    _get_seat_count(trains_info[28])])

    print(pt)



if __name__ == '__main__':
    cil()

以上是本次Demo的完整调用,作为一个Android开发我觉得python还是挺有意思的~

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值