python写了一个小爬虫,半个月前运行还没有问题,结果今天跑了下,出了这么个奇怪的问题:ConnectionAbortedError: [WinError 10053] 你的主机中的软件中止了一个已建立的连接。 (这半个月电脑哪里出问题了???)
完整代码如下:
import urllib.request
from bs4 import BeautifulSoup
import re
def get_soup(url):
"""
解析页面
:param url:
:return: soup
"""
response = urllib.request.urlopen(url)
html = response.read()
soup = BeautifulSoup(html, "html.parser")
return soup
def get(url):
"""
抽取页面中的所有连链接
:param url:
:return: 所有链接列表
"""
soup = get_soup(url)
list_href = []
list_name = []
for each in soup.find_all(href=re.compile('item'))[10:-1]:
list_href.append(''.join(["http://baike.baidu.com", each["href"]]))
for each in soup.find_all(href=re.compile('item'))[10:-1]:
list_name.a