1.输入命令:pip install nltk -i
2.输入两个命令:
import nltk
nltk.download()
报错:
方法一:自己下载语料库
自己去官网下载语料库GitHub - nltk/nltk_data: NLTK Data
下载好nltk_data后,在pycharm控制台打印一下语料库放置地址:
import nltk
nltk.find('.')
我以第二个地址为例,进入该目录,发现没有nltk_data目录,自己建立一个,如图:
从下载解压后文件中找到corpor文件,将corpor文件复制到nltk_data目录下:
测试:
from nltk.corpus import brown print(brown.categories()) print(brown.words())
成功!
方法二:修改ip
找一个能够域名解析的网站,如:https://www.ipaddress.com/或者IP/服务器raw.githubusercontent.com的信息 - 站长工具
将解析后的三个地址都写到hosts文件中,该文件一般位于C:\Windows\System32\drivers\etc
这里会提示权限问题,或者保存的时候会让你另存为一个位置而不是在该目录下修改,可以先另存到一个位置,再将后缀.txt去掉,然后替换C:\Windows\System32\drivers\etc中的hosts,
回到pycharm中输入命令:nltk.download()
可以下载安装了!