python-快速使用urllib爬取网页（3-超时异常）

最新推荐文章于 2024-02-02 14:05:29 发布

沐雨金鳞

最新推荐文章于 2024-02-02 14:05:29 发布

阅读量3.4k

点赞数

分类专栏： python 文章标签：异常爬虫 python

本文链接：https://blog.csdn.net/qq_38262266/article/details/78883377

版权

python 专栏收录该内容

14 篇文章 2 订阅

订阅专栏

爬虫怕的就是超时，而出现最多的就是超时，这种问题如何解决那？

# coding=utf-8
import urllib.request

for i in range(1,100):
    try:
        file = urllib.request.urlopen("http://yum.iqianyue.com",timeout=1)
        data = file.read()
        print(len(data))
    except Exception as e:
        print("出现异常-->"+str(e))

在timeout内不响应则判断为超时（爬取不成功）
自主设置：file=urllib.request.urlopen(“测试网址”,timeout=测试秒数)
功能：某些网站服务器不好的情况下，我们要把timeout设置的大一点，否则爬出失败。

优惠劵

沐雨金鳞

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
python-快速使用urllib爬取网页（3-超时异常）

爬虫怕的就是超时，而出现最多的就是超时，这种问题如何解决那？# coding=utf-8import urllib.requestfor i in range(1,100): try: file = urllib.request.urlopen("http://yum.iqianyue.com",timeout=1) data = file.read()
复制链接

扫一扫