pytho爬虫经常报错错误 Traceback (most recent call last) 错误信息

6 篇文章 0 订阅
3 篇文章 0 订阅

解读错误信息就可以定位错误。
Traceback (most recent call last):
这是错误的跟踪信息。

File "XXX.py", line 13, in <module>
f3('0')

调用f3()出错了,错误出现在文件XXX.py的第13行代码,错误来源第9行:

File “XXX.py”, line 12, in f3

return f2(s)+1

调用f2()出错了,错误出现在文件XXX.py的第12行代码,错误来源第8行:

== File “XXX.py”, line 8, in f2 ==

return f1(s)+1

调用f1()出错了,错误出现在文件XXX.py的第8行代码,错误来源第4行:

==File “XXX.py”, line 4, in f1 ==

return 1 / int(s)

return 1 / int(s)出错了,找到了错误的源头。

== ZeroDivisionError: division by zero==

这是错误类型。
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

原因

当用快速爬取某网站出现经常出现Traceback (most recent call last):的错误,也就是连接失败。原因首先是快速爬取连接时网络不稳定造成的。
一般解决方案:
加入判断函数

def getHTMLText(url):
    maxTryNum = 20
    for tries in range(maxTryNum):
        try:
            kv = {"user-agent": "Mizilla/5.0"}
            response = requests.get(url, headers=kv, timeout=10)
            return response.text
        except:
            if tries < (maxTryNum - 1):
                continue
            else:
                print("Has tried %d times to access url %s, all failed!" % (maxTryNum, url))
                break
  • 2
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值