爬虫-timeout机制-避免网页假死 长时间不加载

爬虫有时候会因为爬去某些网页速度极慢,影响性能。所有可以设置超时时间。 
timeout单位 秒 
设置超时时间为12,使用try语句。

#coding:utf-8
**urllib2**
超时可以通过 urllib2.urlopen() 的 timeout 参数直接设置。
例如:
#coding:utf-8
import urllib2
try:
    url = "http://www.baidu.com"
    f = urllib2.urlopen(url, timeout=12) #timeout设置超时的时间
    result = f.read()
    print result
except Exception as e:
    print ('a',str(e))

如果要永远等待,只需传入一个None

二、错误与异常 
1、遇到网络问题(如:DNS 查询失败、拒绝连接等)时,Requests 会抛出一个 ConnectionError 异常。 
2、如果 HTTP 请求返回了不成功的状态码, Response.raise_for_status() 会抛出一个 HTTPError 异常。 
3、若请求超时,则抛出一个 Timeout 异常。 
4、若请求超过了设定的最大重定向次数,则会抛出一个 TooManyRedirects 异常。 
5、所有Requests显式抛出的异常都继承自 requests.exceptions.RequestException 。
--------------------- 

这样在爬虫的时候,能较好的避免网页假死。

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

南七小僧

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值