python 爬取12306网站车次信息

本文介绍了如何使用Python爬取12306网站的车次信息,尽管12306的数据进行了加密,作者通过研究解析出部分信息。文章详细讲解了爬取过程,包括分析网址请求参数、获取城市列表以及爬取和展示车次数据。最后,作者分享了源代码并鼓励读者交流讨论。
摘要由CSDN通过智能技术生成

12306网站爬取车次信息

本想着可以做一个类似于查询详细车次信息的小工具,但是不尽人意,12306网站爬取的车次信息加密了,研究了一个下午也没有研究出其中全部的信息解密:

爬取的信息如下(举一个例子):
“PCbPusP%2F%2FmzOWewCWL%2Fxp0o0JMnsipqj3%2Flua6c5WsF2DGxvD3T0wcV5xzrjKFFo9ho%2BQuBkzKrr%0A1qXr2gZ1yhNFFycYQlW9%2FtFKu4AJOgE0W8WogfBVzqupe9krUpt4G4ZpuCvfxE68M6IaxbStKTCE%0AVe6mty6uABMveTjShR6RiVAIohcC73%2B6pihFEWF2o3OAQAjwjZ4BLxRiRnPx0Jp%2Ffwq3gRApcfCN%0AE0mwkmoI1icify%2Fz8QSXQynTakVpwiIB7Q%3D%3D|预订|940000K59600|K596|ASR|HZH|XAY|HZH|21:09|20:32|23:23|Y|Cu%2Bp4eBPYbjH%2BDsBwHKgm49ANSRNRzAsDWcYtFH4e%2BX8UAj8wm7p04vROOo%3D|20180823|3|R1|25|43|0|0||||无|||有||无|无|||||10401030|1413|0”

一开始这种信息鬼知道是什么,但是研究了一个下午,数据对应什么算是清楚了,但是他们好像做了一个顺序打乱了。
好吧,不扯那么多,我把有用的信息进行了提取。效果图如下:
这里写图片描述

功能:输入起点城市,输入终点城市,输入日期进行查询车次信息

首先分析网站
对网站进行分析,浏览器 F12 调出检查
可以发现网站信息用的是 网址请求

https://kyfw.12306.cn/otn/leftTicket/query?leftTicketDTO.train_date=2018-08-25&leftTicketDTO.from_station=XAY&leftTicketDTO.to_station=HZH&purpose_codes=ADULT

其他有3个参数:
train_date
from_station
to_station

网址信息上传了这3个参数
这里写图片描述

获取所有城市列表信息

因为城市是简写,所有要获取12306上所有城市的信息
获取网址:
https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_vers

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值