用python 通过12306api抓取列车信息

参考:
12306官方火车票api
12306火车票查询

PS:本文为学习参考实例。代码与上述大体相同。

首先了解这些查询接口是怎么来的

chrome是个好东西,特别是它的控制台能看到很多细节。
12306网站通过chrome可以看到查询票的api
chrome控制台
其中有log? 和 queryA?两种开头的接口,网上介绍log是判断服务是否正常,用queryA进行查询

#在python控制台测试
> import requests
> url = 'https://kyfw.12306.cn/otn/leftTicket/log?leftTicketDTO.train_date=2017-01-11&leftTicketDTO.from_station=BJP&leftTicketDTO.to_station=XAY&purpose_codes=ADULT'
# 这里传入了三个变量,
train_date
from_station
to_station
站名为缩写标准,获得方法见后面介绍

r = requests.get(url, verify = False)
#chrome可以看到它用的是get方法, verify为忽略https
解析结果r.text为字典形式的字符串,通过r.json()得到解析后结果,
ticks = r.json()
分析结构, ticks['data']保存所有车次的信息。G653车次的查询结果表示为
g653 = ticks['data'][1]['queryLeftNewDTO']

从结果中提取需要的字段展示

12306查询结果列表的表头包含如下字段:
车次 出发站/到达站 出发时间/达到时间 历时 商务座 特等座 一等座 二等座 高级软卧 软卧 硬卧 软座 硬座 无座 其他 备注
分析g653对应的key分别为:
station_train_code from_station_name/to_station_name start_time/arrive_time lishi/day_difference swz_num tz_num zy_num ze_num gr_num rw_num yw_num rz_num yz_num wz_num qt_num
车次类型分(G,D,Z,T,K)首位不是字母的是普快。

如下代码根据以上通过接口查询的结果,并根据指定列车类型过滤

#代码与参考中大体相同
#coding=utf-8
from prettytable import PrettyTable

class TrainCollection(object):
    """
    解析列车信息
    """
    header = '序号 车次 出发站/到达站 出发时间/达到时间 历时 商务座  特等座 
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: 好的,这是一个使用 Python 爬虫通过 API 抓取数据的示例: ``` import requests url = "https://api.example.com/data" response = requests.get(url) if response.status_code == 200: data = response.json() print(data) else: print("请求失败,状态码:", response.status_code) ``` 这段代码使用了 `requests` 库发送一个 GET 请求到 API 地址 `https://api.example.com/data`。如果请求成功(即返回状态码为 200),将返回的数据(格式为 JSON)解析并打印。如果请求失败,则打印错误信息。 ### 回答2: 编写一个通过API抓取数据的Python爬虫,主要分为以下几个步骤: 第一步,导入所需的库。首先导入`requests`库用于发送HTTP请求,以获取API的数据。然后导入`json`库用于处理返回的JSON数据。 第二步,定义API的URL和参数。根据需要访问的API,设置相应的URL以及可能需要的参数。例如,如果要从一个天气API中获取某城市的天气数据,可以设置URL为相应的API链接,参数可以是城市的名称、日期等。 第三步,发送HTTP请求并获取数据。使用`requests`库发送GET请求,将API的URL和参数作为参数传递给`requests.get()`函数。然后,使用`response.json()`来获取返回的数据,并将其存储在一个变量中。 第四步,解析数据。根据API返回的数据结构,使用`json`库来解析返回的JSON数据。通常可以使用字典和列表的方式来访问和提取所需的数据。 第五步,处理和存储数据。根据需要,可以对数据进行进一步处理,例如将其转换为CSV文件、存储到数据库或进行可视化处理。 第六步,异常处理。在进行API请求和数据处理的过程中,可能会出现各种错误,例如网络连接错误、API返回错误等。需要使用`try-except`语句来捕获这些异常,并添加适当的处理程序。 第七步,运行爬虫。最后,编写一个主函数,调用前面定义的函数,并运行爬虫代码。可以使用循环来定期执行爬虫,以获取最新的数据。 总结:以上是一个简单的通过API抓取数据的Python爬虫的大致步骤。实际使用时,需要根据具体的API接口和数据处理需求进行相应的调整和优化。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值