Python3网络爬虫教程3——urllib.error的使用

上接:Python3网络爬虫教程2——urlopen的返回对象
https://blog.csdn.net/u011318077/article/details/86510682

2.5. urllib.error

  • URLError产生的原因
    • 没网
    • 服务器连接失败
    • 是OSError的子类
    • 看案例43_7
  • HTTPError是URLError的一个子类
    • 看案例43_8
  • 两者区别:
    • HTTPError是对应的HTTP请求的返回码错误
    • 如果返回错误码是400以上的则返回HTTPError
    • URLError对应的一般是网络出现错误,包括url问题
    • 关系区别:OSError-URLError-HTTPError
  • 爬虫执行以下代码时候,都放在try模块下
    try:
    req = request.Request(url)
    rsp = request.urlopen(req)

43-7

# URLError的使用

from urllib import request, error

if __name__ == '__main__':

    # 输入一个错误网址
    url = 'http://www.sipo.gov.cn/www'
    # 下面网址会自动跳转
    # url = 'http://www.22222fdadfafddddddu.com'

    try:
        req = request.Request(url)
        rsp = request.urlopen(req)
        html = rsp.read().decode()
        print(html)

    except error.URLError as e:
        print("URLError: {0}".format(e.reason))
        print("URLError: {0}".format(e))

    except Exception as e:
        print(e)

    # 错误并没有执行,执try时候网页自动跳转了,跳转到了一个新网页
    # 为了显示错误的结果:
    # 方法1:可以把网断掉,然后再次执行,结果如下
    # URLError: [Errno 11001] getaddrinfo failed
    # URLError: <urlopen error [Errno 11001] getaddrinfo failed>
    # 方法2:将url替换为一个政府的错误网址,结果如下
    # HTTPError: Not Found
    # HTTPError: HTTP Error 404: Not Found

43-8

# HTTPError的使用

from urllib import request, error

if __name__ == '__main__':

    # 输入一个错误网址
    url = 'http://www.sipo.gov.cn/www'

    try:
        req = request.Request(url)
        rsp = request.urlopen(req)
        html = rsp.read().decode()
        print(html)

    except error.HTTPError as e:
        print("HTTPError: {0}".format(e.reason))
        print("HTTPError: {0}".format(e))


    except error.URLError as e:
        print("URLError: {0}".format(e.reason))
        print("URLError: {0}".format(e))

    except Exception as e:
        print(e)

下接:
Python3网络爬虫教程4——UserAgent的使用(用户伪装)(附常用的UserAgent值清单)
https://blog.csdn.net/u011318077/article/details/86508095

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值