1、简介
有的时候,访问一个网页,如果该网页长时间未响应,那么系统就会判断该网页超时了。但是,有的时候我们需要根据自己的需要来设置超时的时间值,比如,以10秒做为判断一个网页是否超时的标准。
2、应用
循环99次爬虫百度首页的网站,将超时时间设置为1秒。
# *-*coding:utf-8*-*
from urllib import request
for i in range(1,100): # 循环99次去爬取网站
try:
file = request.urlopen("http://www.baidu.com",timeout=1) # 超时时间设置为1秒
data = file.read()
print(len(data))
print(i)
except Exception as e:
print("出现异常-->" + str(e))
运行结果如下: