python爬虫---实现项目(二) 分析Ajax请求抓取数据

这次我们来继续深入爬虫数据,有些网页通过请求的html代码不能直接拿到数据,我们所需的数据是通过ajax渲染到页面上去的,这次我们来看看如何分析ajax

我们这次所使用的网络库还是上一节的Requests,结果用到mongodb来存储(需要提前安装pymongo库),开启多线程爬。

 分析:有很多网页打开以后,我们得到html源码并不能得到我们想要的数据,这时网站很有可能是通过ajax来加载的数据。

我们打开调试模式F12,点击NetWork,我们来分析我所要的数据藏在哪里

我们可以看到我们所需要的数据是通过ajax加载出来的。

项目一:分析Ajax来抓取今日头条街拍美图

代码地址:https://gitee.com/dwyui/toutiao_jiepai.git

简单看一下我们的运行结果:

 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值