python爬虫学习18

亦瑕

已于 2022-03-20 19:35:12 修改

阅读量1.2k

点赞数 4

分类专栏： Python爬虫基础学习笔记文章标签： python 爬虫学习

于 2022-03-20 19:33:06 首次发布

本文链接：https://blog.csdn.net/szshiquan/article/details/123619315

版权

本文介绍了Python爬虫的高级用法，包括超时设置，如何处理连接和读取超时，以及身份认证的实现。还探讨了代理设置，并展示了使用Prepared Request类直接发送请求的方式。

摘要由CSDN通过智能技术生成

python爬虫学习18

# requests库中的请求方法下也提供了 timeout 参数我们可以设置该参数，防止过长时间服务器不能响应
# 超时设置
import requests

url = 'https://www.httpbin.org/get'
timeout = 0.5
resp = requests.get(url, timeout=timeout)
# 此处 timeout 设置为 0.5 意为超过0.5秒未响应时就自动抛出异常
print(resp.status_code)

运行结果：

在这里插入图片描述

实际上请求分为两个阶段：

连接（connect）
读取（read）

我们设置的timeout的时间是上两者的总和。既然知道请求由两部分组成，在设置timeout参数时，也可以传入一个元祖，分别设置连接和读取的时间限制：

import requests

url = 'https://www.httpbin.org/get'
timeout = (0.2, 0.3)
resp = requests.get(url, timeout=timeout)
print(resp.status_code)

运行结果：可以看到是连接部分超过了我们设置的时限所以抛出了异常

在这里插入图片描述

import requests

url

最低0.47元/天解锁文章

亦瑕

关注

4
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
python爬虫学习18

python爬虫学习18目录python爬虫学习18高级用法其三1.超时设置2.身份认证3.代理设置4.Prepared Request高级用法其三1.超时设置# requests库中的请求方法下也提供了 timeout 参数我们可以设置该参数，防止过长时间服务器不能响应# 超时设置import requestsurl = 'https://www.httpbin.org/get'timeout = 0.5resp = requests.get(url, timeout=timeout)
复制链接

扫一扫