01.初识爬虫---获取数据---Response对象的常用属性

最新推荐文章于 2023-12-02 13:05:44 发布

Croyance_M

最新推荐文章于 2023-12-02 13:05:44 发布

阅读量4k

点赞数 1

分类专栏：爬虫学习

本文链接：https://blog.csdn.net/Croyance_M/article/details/89636734

版权

本文介绍了爬虫的基本工作原理，包括获取、解析、提取和存储数据的步骤。重点讲解了Python requests库中Response对象的使用，如通过.get()方法发送请求，利用status_code属性检查响应状态，content属性用于下载二进制内容如图片，text属性获取文本内容，以及encoding属性处理字符编码问题。

摘要由CSDN通过智能技术生成

1. 爬虫的工作原理：

（获取数据）当你决定去某个网页时，爬虫可以模拟浏览器去向服务器发送请求
（解析数据）等服务器响应后，爬虫可以代替浏览器帮我们解析数据
（提取数据）接着爬虫可以根据我们设定的规则批量提取相关数据，
（储存数据）最后爬虫可以批量把数据存储到本地

2. 获取爬虫：

requests.get()方法

import requests  
#引入requests库

URL='某网址'
res = requests.get('URL')
#requests.get是在调用requests库中的get()方法，它向服务器发送了一个请求，括号里的参数是你需要的数据所在的网址，然后服务器对请求作出了响应。
#我们把这个响应返回的结果赋值在变量res上。

Response对象的常用属性

将上面代码，加上print(type(res))，输出结果为<class 'requests.models.Response'>，可以看出res是一个对象，属于requests.models.Response类。

属性	作用
res.status_code	检查请求是否成功
res.content	把res对象转换为二进制数据

最低0.47元/天解锁文章

Croyance_M

关注

1
点赞
踩
13

收藏

觉得还不错? 一键收藏
2
评论
01.初识爬虫---获取数据---Response对象的常用属性

1. 爬虫的工作原理：（获取数据）当你决定去某个网页时，爬虫可以模拟浏览器去向服务器发送请求（解析数据）等服务器响应后，爬虫可以代替浏览器帮我们解析数据（提取数据）接着爬虫可以根据我们设定的规则批量提取相关数据，（储存数据）最后爬虫可以批量把数据存储到本地2. 获取爬虫：requests.get()方法import requests #引入requests库URL...
复制链接

扫一扫

专栏目录