python爬取js中数据动态加载的数据_JS动态加载数据不会怎么爬取？老司机教你两个方法爬取想要的数据...

weixin_39959335

于 2020-12-09 09:16:58 发布

阅读量991

点赞数

文章标签： python爬取js中数据动态加载的数据

本文介绍了如何使用Python爬取JavaScript动态加载的数据，以高考查询网站为例，讲解了利用selenium和分析网页元素请求JSON数据的两种方法。selenium方法直观但速度慢，而分析网页元素直接请求原始数据则更高效。

摘要由CSDN通过智能技术生成

学习Python的人绝大部分都是在用Python做爬虫，毕竟对于爬虫而言Python是不二选。

但是一般简单的静态页面网站还是很好爬取的，对于很多动态加载的网站就不知道怎么办了，今天小编就给大家介绍两种爬取js加载的动态数据，希望对爬虫方面有所帮助！

今天咱们就以高考查询网站为例！

如何知道这个网站是动态加载的数据？

用浏览器，这里小编建议使用火狐或者谷歌这个想必大家都知道的

打开你网页，右键查看页面源代码，ctrl +F 查询输入293，源代码里面并没有这个值，说明是动态加载数据。

它的网址是：数字代表的第几页。它一共是165页

所以想要获取全部的url地址就非常简单了

对于动态加载数据，我们常用的两个方法：使用selenium

分析网页元素，找出该数据的原始网页，提交表单，获取不同的数据，用来达到爬取的目的。

方法一selenium：

为什么要这么写，代码里面表明了注释！

小结：通过对数据的分析，写出上面的查找方法，即可获取所有数据。

通过这种方法获取数据，简单，也比较直观，缺点是太慢了。

方法二分

最低0.47元/天解锁文章

weixin_39959335

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。