Python爬虫——去哪儿网评论

本文详细介绍了如何使用Python爬虫抓取去哪儿网周边游页面的评论数据,包括解析页面、寻找动态加载数据的接口、处理POST请求参数等步骤,最终成功获取评论数量等信息。
摘要由CSDN通过智能技术生成

需求

由于疫情的影响,可能大家更加偏向于与家人在周边游~ 所以我们来到去哪儿网的周边游:https://dujia.qunar.com/p/around

界面如下:
在这里插入图片描述
可以看到,我们的周边游也有很多页的数据~如果我们需要去货比n家的话,当然是数据越多越好。但是为了前期分析的便利,我们以第一页为主。那在该页,我们需要获取到的基本信息为:标题,价格,详情页跳转链接

基础需求实现

还是老步骤,在写代码之前,我们需要定位到需求数据所在的url。先来 https://dujia.qunar.com/p/around 康康把~

  • F12 打开谷歌自带的工具
  • 看到 Network/Preview 确认需要数据是否在该页面
    在这里插入图片描述
    结果发现,OMG,没有想要的数据。咋办呢?

因为最开始提到该数据比较多存在翻页,所以我们就需要揣测一下,数据是否是 ajax 动态加载 的。所以我们操作如下:

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值