爬虫学习笔记4——Ajax方式加载的网页内容的获取

最新推荐文章于 2021-06-08 14:38:59 发布

爱吃芝士

最新推荐文章于 2021-06-08 14:38:59 发布

阅读量285

点赞数

分类专栏：学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36193933/article/details/83870288

版权

学习笔记专栏收录该内容

9 篇文章 0 订阅

订阅专栏

Ajax方式加载的网页，我们在用抓包工具抓包的时候，在其html部分返回的固定的界面，是没有包含到网页完整的信息的，其更多的内容是通过json的方式传输到页面上的
Ajax方式加载的页面，其数据来源一定是json，拿到json的话，就拿到了网页的数据。

我们想要拿网页中的json文件，简单的方法，就是通过抓包工具，找到后台传输json文件的地址，在抓包工具中显示的实例（爬取豆瓣网站电影排行榜的的json数据）：
在这里插入图片描述
先在抓包工具中截获的数据流找到json网页，然后这个网页的header第一行就是其存储的地址，我们可以直接通过构建请求访问这个网页地址，来爬取到我们想要的json文件。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬虫学习笔记4——Ajax方式加载的网页内容的获取

Ajax方式加载的网页，我们在用抓包工具抓包的时候，在其html部分返回的固定的界面，是没有包含到网页完整的信息的，其更多的内容是通过json的方式传输到页面上的Ajax方式加载的页面，其数据来源一定是json，拿到json的话，就拿到了网页的数据。我们想要拿网页中的json文件，简单的方法，就是通过抓包工具，找到后台传输json文件的地址，在抓包工具中显示的实例（爬取豆瓣网站电影排行榜的的j...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。