Python的requests库详细介绍

Python requests 库是一个用于发送 HTTP 请求的简单而强大的库,它可以让你轻松地在 Python 中处理 HTTP 请求。这个库是 Python中处理 HTTP 请求的标准工具,因其简洁的 API 和强大的功能而广受欢迎。

1. 安装 requests

pip install requests

2. 基本用法

2.1 导入库

import requests

2.2 发送 GET 请求

GET 请求用于从服务器获取数据。最简单的方式是调用 requests.get() 方法。

response = requests.get('https://jsonplaceholder.typicode.com/posts/1')

2.3 发送 POST 请求

POST 请求用于向服务器发送数据。通常用于提交表单或上传数据。

response = requests.post('https://jsonplaceholder.typicode.com/posts', data={'title': 'foo', 'body': 'bar', 'userId': 1})

3. 请求参数

3.1 URL 参数

可以通过 params 参数向 URL 添加查询字符串参数。

params = {'key1': 'value1', 'key2': 'value2'}
response = requests.get('https://jsonplaceholder.typicode.com/posts', params=params)

这会生成 URL:https://jsonplaceholder.typicode.com/posts?key1=value1&key2=value2

3.2 请求头

使用 headers 参数自定义请求头。

headers = {'User-Agent': 'my-app/0.0.1'}
response = requests.get('https://jsonplaceholder.typicode.com/posts', headers=headers)

3.3 POST 请求中的数据

对于 POST 请求,可以通过 data 或 json 参数发送数据。

  • data 参数用于发送表单数据(application/x-www-form-urlencoded 格式):
response = requests.post('https://jsonplaceholder.typicode.com/posts', data={'key': 'value'})
  • json 参数用于发送 JSON 格式的数据:
response = requests.post('https://jsonplaceholder.typicode.com/posts', json={'key': 'value'})

3.4 上传文件

可以使用 files 参数上传文件。

files = {'file': open('report.txt', 'rb')}
response = requests.post('https://jsonplaceholder.typicode.com/upload', files=files)

4. 响应处理

requests 库返回的 response 对象包含了服务器响应的所有信息。

4.1 访问响应内容

  • 文本内容:使用 response.text 获取响应的文本内容。
print(response.text)
  • JSON 内容:使用 response.json() 解析 JSON 响应。
json_data = response.json()
  • 二进制内容:使用 response.content 获取二进制内容(如图片、文件)。
with open('image.png', 'wb') as f:
    f.write(response.content)

4.2 访问响应状态

  • 状态码:response.status_code 返回 HTTP 状态码。
if response.status_code == 200:
    print('Success!')
else:
    print('Error:', response.status_code)
  • 响应头:response.headers 返回响应头信息。
print(response.headers)

5. 超时和重试

5.1 超时设置

通过 timeout 参数设置请求的超时时间(单位:秒)。

response = requests.get('https://jsonplaceholder.typicode.com/posts', timeout=5)

5.2 请求重试

requests 库没有内建的重试机制,但可以通过 requests.adapters.HTTPAdapter 实现自动重试。

from requests.adapters import HTTPAdapter
from requests.packages.urllib3.util.retry import Retry

session = requests.Session()
retries = Retry(total=5, backoff_factor=0.1, status_forcelist=[500, 502, 503, 504])
adapter = HTTPAdapter(max_retries=retries)
session.mount('http://', adapter)
session.mount('https://', adapter)

response = session.get('https://jsonplaceholder.typicode.com/posts')

6. 会话对象

使用 requests.Session() 可以在多次请求之间共享会话信息(如 Cookies、headers)。

session = requests.Session()
session.get('https://jsonplaceholder.typicode.com/cookies/set/sessioncookie/123456789')
response = session.get('https://jsonplaceholder.typicode.com/cookies')

7. 身份验证

7.1 基本身份验证

可以通过 auth 参数进行基本身份验证。

from requests.auth import HTTPBasicAuth
response = requests.get('https://jsonplaceholder.typicode.com/basic-auth/user/pass', auth=HTTPBasicAuth('user', 'pass'))

7.2 Token 身份验证

对于 Token 验证,可以在请求头中添加 Authorization

headers = {'Authorization': 'Bearer YOUR_ACCESS_TOKEN'}
response = requests.get('https://jsonplaceholder.typicode.com/protected', headers=headers)

8. 代理支持

使用 proxies 参数可以为请求设置代理。

proxies = {
    'http': 'http://10.10.1.10:3128',
    'https': 'http://10.10.1.10:1080',
}
response = requests.get('https://jsonplaceholder.typicode.com', proxies=proxies)

9. SSL 证书验证

requests 默认会验证 SSL 证书。可以通过 verify 参数禁用证书验证(不推荐)。

response = requests.get('https://jsonplaceholder.typicode.com', verify=False)

10. 流式请求

对于大文件,可以使用流式请求来逐步读取响应数据。

response = requests.get('https://jsonplaceholder.typicode.com/large-file', stream=True)
with open('large_file.zip', 'wb') as f:
    for chunk in response.iter_content(chunk_size=8192):
        if chunk:
            f.write(chunk)

11. 错误处理

requests 库会在遇到某些严重错误时抛出异常,如连接失败、超时等。常见的异常包括:

  • requests.exceptions.RequestException
  • requests.exceptions.HTTPError
  • requests.exceptions.ConnectionError
  • requests.exceptions.Timeout
    可以通过 try-except 结构来捕获这些异常并进行处理。
try:
    response = requests.get('https://jsonplaceholder.typicode.com/posts')
    response.raise_for_status()
except requests.exceptions.HTTPError as errh:
    print ("Http Error:", errh)
except requests.exceptions.ConnectionError as errc:
    print ("Error Connecting:", errc)
except requests.exceptions.Timeout as errt:
    print ("Timeout Error:", errt)
except requests.exceptions.RequestException as err:
    print ("OOps: Something Else", err)

12. 自定义适配器

可以创建自定义适配器以实现更复杂的请求行为。例如,实现特定的重试逻辑或日志记录。

总结

requests 库是一种简洁、强大且易于使用的工具,用于处理 HTTP 请求。无论是基本的 GETPOST 请求,还是复杂的身份验证、会话保持和流式处理,requests 都能够很好地胜任。如果你经常处理 HTTP 请求,那么熟练掌握 requests 库将大大提高你的开发效率。

  • 7
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值