python爬取动态网页_python爬取动态网页数据，详解

最新推荐文章于 2024-07-28 17:04:36 发布

weixin_39736047

最新推荐文章于 2024-07-28 17:04:36 发布

阅读量3.2k

点赞数 2

文章标签： python爬取动态网页

本文详细介绍了如何使用Python爬取动态网页数据，通过分析浏览器请求数据的方式，找到API接口，利用requests库发送请求并解析JSON数据。还提到了模拟浏览器行为的Selenium库在爬取动态内容时的应用。

摘要由CSDN通过智能技术生成

原理：动态网页，即用js代码实现动态加载数据，就是可以根据用户的行为，自动访问服务器请求数据，重点就是：请求数据，那么怎么用python获取这个数据了？

浏览器请求数据方式：浏览器向服务器的api（例如这样的字符串：http://api.qingyunke.com/api.php?key=free&appid=0&msg=关键词）发送请求，服务器返回json，然后解析该json，就得到请求数据了

同理：用Python向api发送请求，获得json，解析json，得到数据

即关键在于得到api

api获取：

L3Byb3h5L2h0dHBzL2ltZzIwMTguY25ibG9ncy5jb20vaS1iZXRhLzE3ODU2MzgvMjAxOTEyLzE3ODU2MzgtMjAxOTEyMDYxNTMyNDcxODktMTExNjQyNzg3NS5wbmc=.jpg

将鼠标放在上图图示位置，将显示该用户的一些信息，这些信息就是动态加载出来的。当鼠标放在该位置时，浏览器向服务器api发出请求，得到json，再解析便得到下图所示数据

L3Byb3h5L2h0dHBzL2ltZzIwMTguY25ibG9ncy5jb20vaS1iZXRhLzE3ODU2MzgvMjAxOTEyLzE3ODU2MzgtMjAxOTEyMDYxNTQzMjY3ODktMTQ1MDA4MTQyMC5wbmc=.jpg

在该网页反键选择检查源代码，按图示点开选项：

L3Byb3h5L2h0dHBzL2ltZzIwMTguY25ibG9ncy5jb20vaS1iZXRhLzE3ODU2MzgvMjAxOTEyLzE3ODU2MzgtMjAxOTEyMDYxNTQ2MzMxODAtMTQ0MzEyNzEwNi5wbmc=.jpg

然后将鼠标移动到网页界面用户上（箭头位置），会发现右边多出两个请求信息，如图：

关注