快速简单爬取携程酒店信息简介

通过分析携程网站的Ajax请求,发现可以无限制地获取酒店信息。本文讲述了如何爬取杭州地区的5000家酒店数据。
摘要由CSDN通过智能技术生成

先查看网站发送信息格式,发现可以通过ajax来拿取信息,还没有ip访问限制。然后顺便爬了杭州5000家酒店信息

import scrapy
import time
import json
from xiechen.items import XiechenItem




class XiecSpider(scrapy.Spider):
    name = 'xiec'
    allowed_domains = ['xiecheng.com']


    # http://hotels.ctrip.com/Domestic/Tool/AjaxHotelList.aspx
    def start_requests(self):
        num = 0
        for i in range(300):
            time.sleep(0.5)
            num += 1
            yield scrapy.FormRequest(
                method='POST',
                url="http://hotels.ctrip.com/Domestic/Tool/AjaxHotelList.aspx",
                formdata={
                    "__VIEWSTATEGENERATOR": "DB1FBB6D",
                    "cityName": "%E6%9D%AD%E5%B7%9E",
       
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值