鱼c笔记——Python爬虫(五):访问网页的异常处理

访问网页的异常处理。

当我们的urlopen() 方法无法处理一个响应的时候,就会引发URLError异常。通常在没有网络连接或者对方服务器压根不存在的时候,都会引发这个异常。同时URL会伴随一个reason的属性,用于包含一个由错误编码和错误信息组成的元组。

>>> import urllib.request
>>> import urllib.error  #URLError存在的模块

>>> req = urllib.request.Request('http://412-dfas.com')  #尝试访问一个不存在的链接

>>> try:
	urllib.request.urlopen(req)
except urllib.error.URLError  as e:
	print(e.reason)

	
[Errno 11004] getaddrinfo failed

HTTPError:HTTPError是URLError的一个子类,服务器上每一个HTTP的响应都会返回一个状态码,如404。有时候状态码会指出服务器无法完成的请求类型,一般情况下,Python会帮我们处理一部分这样的请求,例如说响应重定向,要求客户端从别的地方获取文档,urllib模块会自动帮我们处理响应。但是有一些情况是无法处理的。比如404问题,需要人工过滤。


HTTP状态码大全:http://bbs.fishc.com/thread-103840-1-1.html

ps. 400~499表示问题来自客户端,问题是自己。500~599表示问题来自服务器,问题与我们无关。


当出现一个错误的时候,服

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值