携程车次信息爬虫

携程车次信息爬虫

工具:Pycharm,win10,Python3.6.4

1.需求分析

今天我们要爬取携程a上面的车次信息,只爬取直达的班次。我们需要的信息如下

我们以昆山到苏州为例,要获取如下信息,我们查看网页源码发现这些信息并不存在网页源码中。打开开发者工具,点击XHR,我们可以看到数据都存放在一个异步请求中。

数据格式是json,获取很方便,我们要做的就是能获取到该页面信息。我们可以看到这是一个POST请求。

请求参数也比较简单,我直接列出来

value:

{"IsBus":false,"Filter":"0","Catalog":"","IsGaoTie":false,"IsDongChe":false,"CatalogName":"","DepartureCity":"kunshan","ArrivalCity":"suzhou","HubCity":"","DepartureCityName":"昆山","ArrivalCityName":"苏州","DepartureDate":"2019-03-06","DepartureDateReturn":"2019-03-08","ArrivalDate":"","TrainNumber":""}

可以删减一部分参数,删减之后如下

{"IsBus":false,"Filter":"0","Catalog":"","IsGaoTie":false,"IsDongChe":false,"CatalogName":"","HubCity":"","DepartureCityName":"昆山","ArrivalCityName":"苏州","DepartureDate":"2019-03-06","DepartureDateReturn":"2019-03-08","ArrivalDate":"","TrainNumber":""}

我们可以看到需要修改的参数主要就是两个地名。通过修改地名我们就可以批量获取班次信息。

2.数据准备

因为我们要获取全国的班次信息&#x

  • 3
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 6
    评论
以下是爬取程机票信息的Python代码,使用了requests和BeautifulSoup库: ```python import requests from bs4 import BeautifulSoup # 构造请求头 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} # 构造请求参数 params = { 'DCity1': 'BJS', # 出发地 'ACity1': 'SHA', # 目的地 'SearchType': 'S', # 单程 'DepDate1': '2021-12-01', # 出发日期 'IsLowestPrice': 'false', # 不是最低价 'Airline': '', # 航空公司 'FlightNo': '', # 航班号 'IsDirectFlight': 'false', # 不是直达 'SortType': 'a', # 排序方式 'Catalog': '', # 目录 'AllianceID': '', # 联盟ID 'SID': '', # SID 'OUID': '', # OUID 'IsInternal': 'false', # 不是内部 'Action': 'Query', # 查询 'IsDomestic': 'true' # 国内 } # 发送请求 response = requests.get('https://flights.ctrip.com/itinerary/oneway/BJS-SHA', headers=headers, params=params) # 解析网页 soup = BeautifulSoup(response.text, 'html.parser') # 获取机票信息 flight_list = soup.find_all('div', class_='flight_item') # 输出机票信息 for flight in flight_list: print('航班号:', flight['data-flight']) print('航空公司:', flight['data-airline']) print('起飞时间:', flight.find('span', class_='depart_time').text) print('到达时间:', flight.find('span', class_='arrive_time').text) print('出发机场:', flight.find('span', class_='airport').text) print('到达机场:', flight.find_all('span', class_='airport')[1].text) print('机型:', flight.find('span', class_='plane').text) print('价格:', flight.find('span', class_='base_price02').text) print('--------') ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值