pycharm安装nlltk出现的错误
在pycharm中安装nltk后还需进行nltk.download()下载nltk_data
代码:
import nltk
nltk.download()
1、出现错误[winerror10054]:远程主机强迫关闭现有连接;连接被远程主机强行关闭。
错误原因:
1、自己的网络问题(网络卡顿,出现了断网)
2、你请求的网站被封了
3、访问的频率过快也会导致此问题
4、代码有问题
经常见于数据爬取过程中,服务器为了维护自己的安全,对于不正常的访问进行拒绝接入。
总的来说,这个错误是由于你的访问出于某种原因(或访问频率过快(远程过于频繁) / 网络卡顿)使服务器把你当成了不正常的网页浏览者(当成了恶意攻击),此时服务器会拒绝你的访问,进而保护自己的安全。
解决方法:
1、换个网络连接
2、使用time模块
在原代码基础上加上代码:
time.sleep(1) #使代码延迟1s运行
或(下面代码avoid函数借用了别的博客):
import nltk
import time
def avoid_10060(fun):
"""
通过反复尝试延迟函数运行来避免10060错误
"""
error_time = 0
while True:
time.sleep(1)
try:
return fun()
except:
error_time += 1
if error_time == 100:
print('your network is little bad')
time.sleep(60)
if error_time == 101:
print('your network is broken')
break
continue
break
def fun():
nltk.download() #要完成的任务
3、访问一次后关闭连接(用response.close())
(我用的是前两种方法)