是在网络不好的情况下,要是不处理异常,程序很可能会因为报错而终止运行,所以异常处理还是十分有必要的。urllib库中的error模块定义了由request 模块产生的异常。当出现问题时request模块便会抛出error模块中定义的异常。
1、URLError
URLError类来自urllib库的error模块继承自0SError类是error异常模块的基类由request模块产生的异常都可以通过捕获这个类来处理。
它具有一个属性reason,即返回错误的原因。
# urllib, deal with error
import urllib.request
import urllib.error
try:
response = urllib.request.urlopen('https://www.baidu.com/404')
except urllib.error.URLError as e:
print(e.reason) # 输出错误原因
2、HTTPError
-
HTTPError是URLError的子类,专门用来处理HTTP请求错误,例如认证请求失败等。它有如下3个属性
-
code:返回HTTP状态码,例如404表示网页不存在,500表示服务器内部错误等
-
reason:同父类一样,用于返回错误的原因。
-
headers:返回请求头。
HTTPError用法示例如下:
import urllib.request
import urllib.error
try:
response = urllib.request.urlopen('https://www.baidu.com/404')
except urllib.error.HTTPError as e:
print(e.reason, e.code, e.headers, sep='\n')
运行结果如下:
3、urllib异常处理方法
HTTPError为URLError的子类,在异常捕获的时候,可以先选择捕获子类的异常,再捕获父类的异常,使用方法如下:
import urllib.request
import urllib.error
import socket
try:
response = urllib.request.urlopen('https://www.baidu.com/404')
except urllib.error.HTTPError as e:
print(e.reason, e.code, e.headers, sep='\n')
except urllib.error.URLError as e:
if isinstance(e.reason, socket.timeout):
print("Time out!")
else:
print(e.reason)
else:
print('Request Successfully!')