除了10054服务器断开连接问题外,还遇到如下问题:
requests.exceptions.ConnectTimeout: HTTPSConnectionPool(host='servicer address', port=443): Max retries exceeded with url:
因为超过最大重连次数而超时异常。
解决办法是在获取到要爬下来的东西后,及时增加res .close()语句,类似下面:
res = requests.get(url, headers={'User-Agent': random.choice(user_agent_list)})
你对res的解析、保存等处理代码
res .close()
time.sleep(1)