利用post请求爬取动态评论

本文介绍如何使用Python进行POST请求来爬取酒店网站的动态评论。由于评论信息是实时更新且不在网页源代码中,因此需要通过分析请求参数,如listRequest.hotelIDs(对应于页面上的"data-hotelid"),来发送POST请求获取全部评论数据。
摘要由CSDN通过智能技术生成

任务:利用post请求爬取动态评论

实现:

       酒店网站的评论是动态的,是实时更新的,所以在网页源代码里只有一部分,所以要想得到所有的就得在网页的检查元素里(我的是火狐浏览器),右击检查元素,如下图




       一般get请求就可以得到网页源代码里边我们想要的,但是不能得到动态信息,所以要用post请求,此时我们需要参数里面的listRequest.hotelIDs,这是为什么呢?因为在网页源代码里,每家酒店是以不同的data-hotelid来区分,每个酒店都有不同的data-hotelid,post请求可以得到如下



代码如下

#使用的库

import urllib
import requests
import time
from bs4 import BeautifulSoup
import sys
r
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值