Requests 库
响应内容
除了常规的相应内容,还有一些二进制的响应内容,又或者是 JSON 响应内容。由于能力有限,我直接复制管反复文档关于这部分的内容上来。
二进制响应内容
你也能以字节的方式访问请求响应体,对于非文本请求:
Requests 会自动为你解码 gzip 和 deflate 传输编码的响应数据。
例如,以请求返回的二进制数据创建一张图片,你可以使用如下代码:
from PIL import Image
from io import BytesIO
i = Image.open(BytesIO(r.content))
JSON 响应内容
Requests 中也有一个内置的 JSON 解码器,助你处理 JSON 数据:
如果 JSON 解码失败, r.json() 就会抛出一个异常。例如,响应内容是 401 (Unauthorized),尝试访问 r.json() 将会抛出 ValueError: No JSON object could be decoded 异常。
需要注意的是,成功调用 r.json() 并不意味着响应的成功。有的服务器会在失败的响应中包含一个 JSON 对象(比如 HTTP 500 的错误细节)。这种 JSON 会被解码返回。要检查请求是否成功,请使用 r.raise_for_status() 或者检查 r.status_code 是否和你的期望相同。
添加 headers
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; …) Gecko/20100101 Firefox/66.0'
}
r = requests.get("http://httpbin.org/get", headers=headers)
print(r.headers)
下面的运行的结果的截图:
Cookies
r = requests.get("https://www.baidu.com")
print(r.cookies)
下面是运行结果的截图。
显然,它返回的 cookies 是 RequestsCookieJar 对象。