urllib异常处理URLError、HTTPError
一、异常处理
urllib 的 error 模块定义了由 request 模块产生的异常。 如果出现了问题, request 模块便会抛州 error 模块中定义的异常
二、URLError
(1)来源
URLError 类来自 urllib 库的 error 模块,它继承自 OSError 类,是 error 异常模块的基类,由 request 模块生的异常****都可以通过捕获这个类来处理。
(2)属性
reason 异常产生原因
reason 属性返回的不一定是字符串,也可能是一个对象
import socket
from urllib import request,error
url1='http://www.baidu.com'
url2='http://www.mingyuewumingyue.com'
try:
r=request.urlopen(url1,timeout=0.01)
except error.URLError as e:
print(type(e.reason))
if isinstance(e.reason,socket.timeout):
print('timeout')
<class ‘socket.timeout’>
timeout
###(3)代码示例
from urllib import request,error
url1='http://www.baidu.com'
url2='http://www.mingyuewumingyue.com'
try:
r=request.urlopen(url2)
print(type(r))
except error.URLError as e:
print(e.reason)
结果:getaddrinfo failed ,这个就是异常原因 俄、e.reason
三、HTTPError
(1)来源
它是 URLError 的子类,专门用来处理 HTTP 请求错误,比如认证请求失败等
总结:OSError-------->URLError-------->HTTPError
(2)属性
code: 返回 HTTP 状态码,比如 404 表示网页不存在, 500 表示服务器内部错误等
reason:异常原因
headers:返回请求头部
(3)代码示例
from urllib import request,error
url1='http://www.baidu.com'
url2='http://www.mingyuewumingyue.com'
try:
r=request.urlopen(url2)
except error.HTTPError as e:
print(e.reason,e.code,e.headers)
except error.URLError as e:
print(e.reason)
else:
print(type(r))
结果:getaddrinfo failed
`