PYTHON爬取波涛酒店

本人(ID:蒸发杰作)小A和我讨论爬虫的合法性,我冷笑,您可以去和大公司谈谈使用我们数据的合法性。

波涛酒店,国内一个挺大的酒店集团。爬取它的数据倒是可以做一些数据分析,甚至可以在地图上可视化一下,也可以用来指导一下合理定酒店什么的。如果你能做到每日更新这些数据的话,甚至还可以去挖掘低价房,优惠券诸如此类。

开始

URL:https://www.plateno.com/
在这里插入图片描述
抓包:输入武汉后搜索发现,抓取对应的PYTHON包
在这里插入图片描述
请求网址:https://www.plateno.com/api/hotel/searchHotels
请求方法:POST
于浏览器中抓取全部请求头,全部请求data,此网站没有应用Cookies,无妨。

代码

import requests as re
url='https://www.plateno.com/api/hotel/searchHotels'
data={
      "checkInDate":"2019-04-09",
        "cityCode":"AR02960",
      "days":1,
      "districtCode":"",
      "keyWord":"",
      "brands":[],
      "starTypes":[],
      "bzLat":"",
      "bzLng":"",
      "loLat":30.593098,
      "loLng":114.305392,
      "sort":7,
      "minPrice":0,
      "maxPrice":"1000",
      "page":2,
      "size":10,
      "oversea":'false',
      "channelCode":"CA00003",
      "webSource":"PC_PLATENO"}
headers=headers={
	'Host': 'www.plateno.com',
	'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:66.0) Gecko/20100101 Firefox/66.0',
	'Accept': 'application/json, text/plain, */*',
	'Accept-Language': 'zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2',
	'Accept-Encoding': 'gzip, deflate, br',
	'Referer': 'https://www.plateno.com/HotelSearch/?checkinDate=2019-04-09&checkoutDate=2019-04-10&cityCode=AR02960&queryWords=&cityName=%E6%AD%A6%E6%B1%89&extend=1,1,0,0,0,0',
	'Content-Type': 'application/json;charset=utf-8',
	'Content-Length': '299',
	'Connection': 'keep-alive',
	'Pragma': 'no-cache',
	'Cache-Control': 'no-cache'
}
import json
a=re.post(url,data=json.dumps(data),headers=headers)
print(a)

至此酒店抓取完成,需要注意的是data接受的json文件格式,因而import json库对其json化。

应用场景

目前我一没有比赛可以用这个,其他也没有这个需要,就没有去构想应用,有想做这个的人倒是可以联系我。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值