Python爬虫（四） URLError、HTTPError异常处理

最新推荐文章于 2024-08-15 16:53:24 发布

another静静

最新推荐文章于 2024-08-15 16:53:24 发布

阅读量3.3k

点赞数 1

文章标签： python 异常处理爬虫

本文链接：https://blog.csdn.net/yj928674542/article/details/78468050

版权

本文介绍了Python爬虫中遇到的URLError和HTTPError异常。当尝试访问不存在的网址时，会触发URLError。HTTPError是URLError的子类，与HTTP状态码相关，通常涉及400-599范围的错误代码。文章通过实例展示了如何使用try-except捕获并处理这些异常。

摘要由CSDN通过智能技术生成

1.URLError

首先解释下URLError可能产生的原因：

网络无连接，即本机无法上网
连接不到特定的服务器
服务器不存在

在代码中，我们需要用try-except语句来包围并捕获相应的异常。下面是一个例子：

import urllib.request

request = urllib.request.Request(‘https://www.xxx.com‘)
try:
urllib.request.urlopen(request)
print(“success”)
except urllib.request.URLError as e:
print(“error”,e)

我们利用了 urlopen方法访问了一个不存在的网址，运行结果如下：

error <urlopen error [WinError 10060] 由于连接方在一段时间后没有正确答复或连接的主机没有反应，连接尝试失败。>

2.HTTPError

HTTPError是URLError的子类，在你利用urlopen方法发出一个请求时，服务器上都会对应一个应答对象response，其中它包含一个数字”状态码”。举个例子，假如response是一个”重定向”，需定位到别的地址获取文档&#

最低0.47元/天解锁文章

another静静

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫