12306余票爬虫
1.网页分析
1.1
打开12306余票查询的界面(https://kyfw.12306.cn/otn/leftTicket/init)。普通查询需要输入出发地,目的地和时间,试着输入一下。
1.2
信息更新,页面没有跳转。看下发包情况。
1.3
发现有个包带有’queryX’字段,一看就非常可疑,点开看看。
1.4
ok,这就是我们要的余票信息,不急,先回头解析这余票信息API。
1.5
截去地址前段,留下部分可拆为:
leftTicketDTO.train_date=2017-10-07
&leftTicketDTO.from_station=BJP
&leftTicketDTO.to_station=CQW
&purpose_codes=ADULT
四个参数,用途一目了然。但车站信息是用三位大写字母表示的,包数据里也没有相关内容,有点头疼。
1.6
回到网页找线索。在站点名称输入框出发现值:from_station_name。尝试搜索station_name,有眉目了。