python12306_Python爬取12306车次信息代码详解

详情查看下面的代码:

如果被识别就要添加一个cookie如果没有被识别的话就要一个user—agent就好了。如果出现乱码就设置编码格式为utf-8

#静态的数据一般在elements中(复制文字到sources按ctrl+f搜索。找到的为静态),而动态去network中去寻找相关的信息

import requests

import re

def send_request():

headers = {'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.131 Safari/537.36'

,'Cookie':'_uab_collina=159618052151589201474313; JSESSIONID=D33C89D8BEC6A692C79CFA69FC0B0D29; BIGipServerotn=233832970.24610.0000; BIGipServerpool_passport=216859146.50215.0000; RAIL_EXPIRATION=1596443951465; RAIL_DEVICEID=nMo94O2Z21cXLblW7otLoxUZ_LP9Q01PYj_I89OqU6MqjxyX9814Jc3CH5TNwgBVJqnBaBG8OGiBWo2QtNcu5wVu-asNk6YLa49g0fMwVp03XFJQ-GkhHYHcqIgUd-nqQB_VEdWH1Om_D2yAgIu8QcEavt02pmH5; route=c5c62a339e7744272a54643b3be5bf64; _jc_save_fromStation=%u5317%u4EAC%2CBJP; _jc_save_toStation=%u5929%u6D25%2CTJP; _jc_save_fromDate=2020-07-31; _jc_save_toDate=2020-07-31; _jc_save_wfdc_flag=dc'}#创建头部信息

url='https://kyfw.12306.cn/otn/leftTicket/query?leftTicketDTO.train_date=2020-07-31&leftTicketDTO.from_station=BJP&leftTicketDTO.to_station=TJP&purpose_codes=ADULT'

#设置编码格式。防止乱码

resp=requests.get(url,headers=headers)

resp.encoding='utf-8'

return resp

#解析数据

#{}是字典。根据key获取值。

def parse_json(resp,city):

json_ticket=resp.json()#将相应的数据转换为json

data_list=json_ticket['data']['result']#得到车次的列表

lst=[]#列表

for item in data_list:

#遍历车次信息进行分割

d=item.split('|')

lst.append([d[3],city[d[6]],city[d[7]],d[31],d[30],d[13]])

return lst

'''

d[3]从列表中获取索引为3的表示车次

d[6]查询起始站

d[7]查询到达站

d[31]一等座

d[30]表示二等座

d[13]表示出行时间'''

#获得station_name的信息

def get_city():

url='https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.9151'

headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.131 Safari/537.36'}

resp=requests.get(url,headers=headers)

resp.encoding='utf-8'

#进行数据的提取(只要一部分)

stations=re.findall('([\u4e00-\u9fa5]+)\|([A-Z]+)',resp.text)

#将列表进行转换为字典

stations_data=dict(stations)

#key与value进行互换

station_d={}#空字典。用于完成上述操作

for item in stations_data:

station_d[stations_data[item]]=item

#print(station_d)

return station_d

def start():

lst=parse_json(send_request(),get_city())

#进行数据的筛选(得到有效的数据)

for i in lst:

if i[3]!='无' and i[3]!='':

print(i)

if __name__=='__main__':

start() #开始

运行的截图:

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值