自然语言处理-nltk环境安装

nltk环境安装

1.pip或者conda安装nltk之后,在python环境中导入nltk没报错就说明安装OK。
在这里插入图片描述

2.安装nltk依赖的数据
nltk有一些自带的数据,比如语料,多种语言的停用词等等,这些数据都需要单独安装。
安装nltk需要的一些数据,理论上是可以通过
nltk.download()或者下载某一个数据,比如punkt: nltk.download(punkt) ,但是这些命令我都无法正常运行,会提示网络无法连接,可能是我的网络不能翻墙?只能通过离线下载数据然后放在指定的目录下来解决。

  • 如果没有依赖的数据,再用某些包的时候会出现以下问题。
    在这里插入图片描述

  • 离线下载nltk数据
    GitHub网址: https://github.com/nltk/nltk_data
    gitee网址: nltk_data: NLTK Data - Gitee.com
    数据资源在以上两个网站中,GitHub下载会很慢,gitee上会快很多。

资源中的packages目录是我们需要的数据,下载到本地之后,解压放在上个截图有关路径下的任何一个就可以,这里我自己选择在我自己的虚拟环境tensorflow_env下,将下载好的包里面的packages目录复制一份到tensorflow_env目录下,并将packages重命名为nltk_data。

在这里插入图片描述

重命名后文件如下:
在这里插入图片描述

如果文件夹下有压缩文件,都需要解压出来,这样导入才不会报错。

查看nltk_data文件目录

nltk.data.find(".")
在这里插入图片描述

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值