python爬虫学习18

本文介绍了Python爬虫的高级用法,包括超时设置,如何处理连接和读取超时,以及身份认证的实现。还探讨了代理设置,并展示了使用Prepared Request类直接发送请求的方式。
摘要由CSDN通过智能技术生成

python爬虫学习18

高级用法其三
1.超时设置
# requests库中的请求方法下也提供了 timeout 参数我们可以设置该参数,防止过长时间服务器不能响应
# 超时设置
import requests

url = 'https://www.httpbin.org/get'
timeout = 0.5
resp = requests.get(url, timeout=timeout)
# 此处 timeout 设置为 0.5 意为超过0.5秒未响应时就自动抛出异常
print(resp.status_code)

运行结果:

在这里插入图片描述

实际上请求分为两个阶段:

  • 连接(connect)
  • 读取(read)

我们设置的timeout的时间是上两者的总和。既然知道请求由两部分组成,在设置timeout参数时,也可以传入一个元祖,分别设置连接和读取的时间限制:

import requests

url = 'https://www.httpbin.org/get'
timeout = (0.2, 0.3)
resp = requests.get(url, timeout=timeout)
print(resp.status_code)

运行结果:可以看到是连接部分超过了我们设置的时限所以抛出了异常

在这里插入图片描述

import requests

url 
  • 4
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值