安装nltk库及nltk_data数据包

一、安装nltk库

1.查看官方文档的方法(笔者没使用这种方法)

Installing NLTK
(Win、Linux、Mac的安装都有讲解,但笔者没使用这种方法。)

2.使用PyCharm安装

系统设置里找到Python Interpreter(译为python解释器)。
在这里插入图片描述

看看当前有哪些解释器,选择一个当前正在使用的解释器。然后点击左侧+号
在这里插入图片描述
输入要安装的nltk库,点击下方Install Package,等待即可。
在这里插入图片描述

3.测试是否安装完成

可以用以下代码测试nltk分词的功能:

from nltk.tokenize import wordpunct_tokenize

if __name__ == "__main__":
    s = '''Good muffins cost $3.88\nin New York.  Please buy me
    ... two of them.\n\nThanks.'''
    print(wordpunct_tokenize(text=s))  # 分词

出现下图结果,说明安装成功。
在这里插入图片描述

二、安装nltk_data数据包

1.用官方文档的方法(笔者试过但是失败了)

官方文档:Installing NLTK Data
以下是我的操作步骤:

首先,尝试直接在编辑器里输入下方代码:

import nltk
nltk.download()

这样子,大概率是失败的。原文(如下)中提到“do the following from an administrator account.”,但我没有给PyCharm管理员权限。
在这里插入图片描述
应该在命令行输入:sudo python,再输入上面的两行代码。
在这里插入图片描述
然后出现这个弹窗。
在这里插入图片描述
注意:针对不同系统,官方给出了推荐的Download Directory(下载目录)。所以,上方的弹窗的Download Directory可以设置为推荐路径。
在这里插入图片描述
但是不知道是不是网络问题,无法使用这种方法。

2.下载nltk数据包,移到相应文件夹下。(亲测有效)

这个博客讲述了这种方法:离线下载安装NLTK的nltk_data数据包

2.1下载nltk数据包:

三个资源:

以码云为例,只需要把项目的整个packages文件夹下载下来。
在这里插入图片描述

2.2查看packages文件夹应该放在哪个路径下

使用以下代码,即可查看nltk的搜索路径。

import nltk

if __name__ == "__main__":
    print(nltk.find("."))

例如,我的路径为:
在这里插入图片描述
下一步,就是解压文件(文件解压后,命名为nltk_data!!!),移动文件到/Users/luonaer路径下,替换掉已有的nltk_data文件夹。
执行成功后,应该如下图所示:
在这里插入图片描述

2.3验证是否安装成功

直接执行下方的代码,

from nltk.book import *

成功安装的话,会出现下图所示的输出。
在这里插入图片描述

Visual Studio Code (VSCode) 是一个非常流行的轻量级文本编辑器,支持多种语言的开发,包括Python。要在VSCode中使用nltk(Natural Language Toolkit),你需要先确保Python环境已经设置好,并安装了pip包管理器。以下是安装nltk在VSCode中的步骤: 1. 安装Python:如果你还没有安装Python,可以从官网下载并安装最新版本的Python(https://www.python.org/downloads/)。 2. 打开VSCode:启动VSCode,如果还没配置Python,可以安装官方推荐的Python插件 "Python" 或 "Pylance" 来提供更好的Python支持。 3. 安装Python插件:打开命令面板(快捷键 `Ctrl + Shift + P` 或 `Cmd + Shift + P`),输入 "Install Python Extension" 并选择你要安装的插件。例如,对于 "Python" 插件,会自动安装对应的Python版本支持。 4. 配置Python环境:打开设置(`Ctrl + ,` 或 `Cmd + ,`),搜索 "python interpreter",点击 "Add Path to Workspace" 或 "Add Path to Global" 根据需求添加Python路径。 5. 安装nltk:在终端(通过插件 "Terminal" 或 " integrated terminal")中,使用pip安装nltk: ``` pip install nltk ``` 6. 导入并下载数据:第一次使用nltk时,需要下载一些资源,如词汇资源等。在终端中运行: ```python import nltk nltk.download('all') ``` 如果你想下载特定的数据集,可以用 `nltk.download()` 函数替换 'all'。 完成以上步骤后,你就可以在VSCode的Python环境中使用nltk了。
评论 14
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值