【python爬虫】了解web解析的过程

从天而降的拳

已于 2022-07-19 17:51:08 修改

阅读量357

点赞数 1

分类专栏： python爬虫文章标签： python 爬虫

于 2022-07-06 16:28:19 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43111389/article/details/125641343

版权

python爬虫专栏收录该内容

4 篇文章 0 订阅

订阅专栏

【python爬虫】了解web解析的过程

- 服务器渲染
- 客户端渲染

我们利用python去爬取我们所需要的信息，无非就是让电脑代替人去从目标网站上获得信息，那么我们想要获取数据，首先需要明白，服务端的数据是如何传送到我们的网页上的。

服务器渲染

在服务器那边直接与html整合在一起，在源代码里面有显示,响应过程如下：
在这里插入图片描述
它只进行一次请求，当我们（我用的chrome）打开开发者工具的时候我们在network一栏中能发现服务器传回来的各种数据，当我们点开返回的前端代码，发现，我们所需要的数据也在这份代码中，这就是服务器渲染：（这样的数据也是最好获取的数据）在这里插入图片描述

客户端渲染

客户端渲染相较于服务器渲染，比较麻烦，但是网页的运行效率更高，这种方式一般也采用的是ajax框架。第一次请求只要一个html骨架，第二次通过运行一个js进行一次请求获得数据，在源代码中看不到数据
在这里插入图片描述
例如，我们利用百度翻译查询 dog，然而我们并没有在其第一次返回的html框架中找到与其相关的内容：

但是，我们发现当我们选择network标签下的Fetch/XHR标签时，却能在里面找到我们所需要的数据。这个标签里面的文件就是服务器第二次发送回来的数据：
在这里插入图片描述
熟练使用浏览器抓包工具,能让我们更好的分析数据，解析数据

从天而降的拳

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【python爬虫】了解web解析的过程

我们利用python去爬取我们所需要的信息，无非就是让电脑代替人去从目标网站上获得信息，那么我们想要获取数据，首先需要明白，服务端的数据是如何传送到我们的网页上的。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。