Python爬虫入门:urllib中的异常处理

简介

urllib库的error模块定义了由request模块产生的异常。如果有问题,request模块会抛出error模块中定义的异常。

URLError

URLError是error异常模块的基类,request产生的异常都可以捕获。

from urllib import request,error
try:
	response = request.urlopen('https://www.qq.com/index.html')
except error.URLError as e:
	print(e.reason)

HTTPError

HTTPError是URLError的子类,专门处理HTTP请求错误,比如认证失败等。

属性作用
code返回HTTP状态码,比如404等
reason返回错误的原因
headers返回请求头

简单实例

from urllib import request,error
try:
	response = request.urlopen('https://www.qq.com/index.html')
except error.HTTPError as e:
	print(e.reason,e.code, e.headers, sep='\n')

优化写法

from urllib import request,error
try:
	response = request.urlopen('https://www.qq.com/index.html')
except error.HTTPError as e:
	print(e.reason,e.code, e.headers, sep='\n')
except error.URLError as e:
	print(e.reason)
else:
	print('Request Successfully')

reason可以不是字符串而是一个对象

超时的情况下,异常的reason就是一个socket.timeout对象。

import socket
from urllib import request,error

try:
	response = request.urlopen('https://www.baidu.com', timeout=0.01)
except error.URLError as e:
	if isinstance(e.reason, socket.timeout):
		print('TIME OUT')
else:
	print('Request Successfully')
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值