一、Requests库入门(学习笔记）

最新推荐文章于 2024-08-08 18:42:28 发布

上野敬芜

最新推荐文章于 2024-08-08 18:42:28 发布

阅读量451

点赞数

分类专栏： Python网络爬虫与信息提取文章标签： python

本文链接：https://blog.csdn.net/shangyejingwu/article/details/113180972

版权

本文是关于Python Requests库的学习笔记，涵盖了安装、主要方法、HTTP协议和Requests库的详细方法解析，包括get、post、put等HTTP请求方法的使用，并提供了通用的代码框架和HTTP协议的理解。

摘要由CSDN通过智能技术生成

更多的信息可以访问：http://www.python-requests.org

打开cmd控制台；
输入命令：pip install requests即可进行安装

尝试后提示没有此命令发现应该要首先下载Python。安装好了python以后就可以安装requests了（虽然有两个WARNING,但是貌似已经安装成功了）

方法	说明
requests.request(）	构造一个请求，支撑以下各方法的基础方法
requests.get()	获取HTML网页的主要方法，对应于HTTP的GET
requests.head()	获取HTML网页头信息的方法，对应于HTTP的HEAD
requests.post()	向HTML网页提交POST请求的方法，对应于HTTP的POST
requests.put()	向HTML网页提交PUT请求的方法，对应于HTTP的PUT
requests.patch()	向HTML网页提交局部修改请求，对应于HTTP的PATCH
requests.delete()	向HTML页面提交删除请求，对应于HTTP的DELETE

说明：除了request()方法是基础外，其余的6个方法都是通过调用requests方法来实现的

Response对象包含爬虫返回的内容

>>> import requests # 调用requests库
>>> r = requests.get("http://www.baidu.com") # 访问百度的主页
>>> print(r.status_code) # 检测请求的状态码

状态码为200，访问成功；反之失败

>>> type(r) # 检测r的类型

<class 'requests.models.Response'>

返回表示r是一个类，这个类的名是Response

>>> r.headers # 返回get请求获得页面的头部信息

'Cache-Control': 'private，no-cache，no-store，proxy-revalidate,ection': 'Keep-Alive'， 'Transfer-Encoding': 'chunked', 'server':

Response包含服务器返回的所有信息，同时也包含了我们向服务器请求的request信息

自己尝试：（Python自带的IDLE）

Response对象的属性(最常用、最必要)

属性	说明
r.status_code	HTTP请求的返回状态，200表示连接成功，404表示失败
r.text	HTTP响应内容的字符串形式，即，url对应的页面内容
r.encoding	从HTTP header中猜测的响应内容编码方式
r.apparent_encoding	从内容中分析出的响应内容编码方式（备选编码方式）
r.content	HTTP响应内容的二进制形式