本文总结 web
开发中 request
模块使用的不完全总结。
Updated: 2022 / 7 / 27
Response
常用属性
做 request
请求的时,返回数据为 requests.models.Response
。
我们需要对返回结果做处理 1。
Response
响应的常用属性:
属性 | 含义 |
---|---|
response.text | 响应回去的文本(字符串)。 |
response.content | 响应回去的内容(二进制),内容类型为 <class 'bytes'> ,一般用来爬取视频。也可以使用 response.content.decode('utf-8') 将内容转为字符串格式。 |
response.status_code | 响应的状态码 |
response.url | 获取请求连接地址 |
response.cookies | 获取返回的 cookies 信息,其类型为 <class 'requests.cookies.RequestsCookieJar'> 。 |
response.cookies.get_dict() | 获取返回的 cookies 信息,其类型为 <class 'dict'> |
response.request | 获取请求方式 |
如果存在爬取文档乱码的问题,可采用以下方法:
方法 | 含义 |
---|---|
response.apparent_encoding | 文档的编码的方式(从 HTML 文档找) |
response.encoding | 响应体编码方式 eg: response.encoding = response.apparent_encoding 文档的声明方式 |
返回结果
使用 response.json()
将返回结果转化为 josn
格式,我们进行反序列化。
其他方法
方法 | 含义 |
---|---|
response.headers | 查看响应头,其相应类型为 <class 'requests.structures.CaseInsensitiveDict'> 。 |
response.history | 重定向历史 即前一次请求的地址,其相应类型为 <class 'list'> 。 |