python爬虫教程（3）-requests爬取静态网页

最新推荐文章于 2024-04-21 16:55:59 发布

Ejasmine

最新推荐文章于 2024-04-21 16:55:59 发布

阅读量3.4k

点赞数 5

分类专栏： python入门爬虫教程 python爬虫教程从入门到精通文章标签： python 网络爬虫

本文链接：https://blog.csdn.net/weixin_42183408/article/details/87295437

版权

欢迎来到python爬虫大讲堂，现在开始你的爬虫旅程吧！

静态网页

在网站中，纯HTML格式的网页被称为静态网页，在我们的爬虫中，静态网页较容易获取，因为页面上的内容都在HTML代码上，关于静态网页，我们可以使用requests库，之前我们已经安装过requests库了，所以我们直接开始：

获取相应内容

import requests
r=requests.get('https://blog.csdn.net/weixin_42183408')
print("文本编码：",r.encoding)
print("响应状态码：",r.status_code)
print("字符串方式的响应体：",r.text)

你会得到这样：
在这里插入图片描述
接下来我们来看看说明：

r.text：服务器响应内容，就是HTML编码
r.encoding：服务器的文本编码
r.status_code：响应的状态码，如果是200则代表访问成功
r.content：字节方式的响应体

定制requests

定制请求头

请求头headers提供了信息，对于爬虫来说，一个程序几

最低0.47元/天解锁文章

Ejasmine

关注

5
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
python爬虫教程（3）-requests爬取静态网页

欢迎来到python爬虫大讲堂，现在开始你的爬虫旅程吧！静态网页在网站中，纯HTML格式的网页被称为静态网页，在我们的爬虫中，静态网页较容易获取，因为页面上的内容都在HTML代码上，关于静态网页，我们可以使用requests库，之前我们已经安装过requests库了，所以我们直接开始：获取相应内容import requestsr=requests.get('https://blog.cs...
复制链接

扫一扫