python网络爬虫笔记01：基础知识与简单案例

最新推荐文章于 2022-04-20 12:20:36 发布

小薛引路

最新推荐文章于 2022-04-20 12:20:36 发布

阅读量151

点赞数

分类专栏： python网络爬虫笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m1m2m3mmm/article/details/117733165

版权

python网络爬虫笔记专栏收录该内容

21 篇文章 2 订阅 ¥39.90 ¥99.00

订阅专栏

超级会员免费看

本文介绍了Python网络爬虫的基础知识，包括网页的服务器端和客户端渲染方式、HTTP协议的请求头和响应头、URL结构，以及GET和POST请求的区别。通过实例展示了包的安装、搜狗、百度翻译和豆瓣的爬虫实验，帮助读者理解网络爬虫的基本原理和实践应用。

摘要由CSDN通过智能技术生成

目录

1. 网页的两种渲染方式

3 包的安装与搜狗爬虫实验

4 百度翻译爬虫实验

5 豆瓣爬虫实验

1. 网页的两种渲染方式

1 服务器端渲染：在服务器端直接将数据和html整合在一起，统一返回给浏览器；此时，我们在页面源代码中可以看到网页的完整内容。

2 客户端渲染：第一次请求浏览器端仅仅是返回一个html的骨架；第二次请求拿到数据，进行展示。此时，我们在网页源代码中是看不到数据的，需要借助抓包工具，找到数据请求的链接。

通用爬虫与聚焦爬虫：

通用爬虫：满足一般的爬虫需求，如百度；但是对视频和图片的爬取能力较弱
聚焦爬虫：针对具体的应用目的，尽量排除与需求无关的信息

了解本专栏

超级会员免费看

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

小薛引路 喜欢的读者，可以打赏鼓励一下

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。