nltk库安装教程

 一、nltk是什么

NLTK(Natural Language Toolkit)是一个用于自然语言处理和文本分析的 Python 库。

它提供了一系列易于使用的工具和接口,用于处理和分析文本数据。

NLTK 支持众多自然语言处理任务,例如文本分类、语法分析、词性标注、文本语料库处理等。

NLTK 还包含大量的语言数据和模型,可以用于训练自然语言处理模型和进行语言分析。

NLTK 的优点在于它具有丰富的文档和教程,易于上手,并且可以与其他 Python 库和工具集成使用。因此,NLTK 是自然语言处理领域中非常受欢迎的工具之一。

nltk也是众多自然语言模型的基础依赖。

二、安装nltk

pip install nltk

(d2l) xugj@lenovo:~/d2l$ pip install nltk
Looking in indexes: https://pypi.tuna.tsinghua.edu.cn/simple
Collecting nltk
  Using cached https://pypi.tuna.tsinghua.edu.cn/packages/a6/0a/0d20d2c0f16be91b9fa32a77b76c60f9baf6eba419e5ef5deca17af9c582/nltk-3.8.1-py3-none-any.whl (1.5 MB)
Collecting click
  Using cached https://pypi.tuna.tsinghua.edu.cn/packages/c2/f1/df59e28c642d583f7dacffb1e0965d0e00b218e0186d7858ac5233dce840/click-8.1.3-py3-none-any.whl (96 kB)
Collecting joblib
  Using cached https://pypi.tuna.tsinghua.edu.cn/packages/91/d4/3b4c8e5a30604df4c7518c562d4bf0502f2fa29221459226e140cf846512/joblib-1.2.0-py3-none-any.whl (297 kB)
Collecting regex>=2021.8.3
  Using cached https://pypi.tuna.tsinghua.edu.cn/packages/29/90/804db81268636547e25004404587e75a269fd6f7a38aa2d9e1209ed61544/regex-2023.3.23-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (769 kB)
Collecting tqdm
  Using cached https://pypi.tuna.tsinghua.edu.cn/packages/e6/02/a2cff6306177ae6bc73bc0665065de51dfb3b9db7373e122e2735faf0d97/tqdm-4.65.0-py3-none-any.whl (77 kB)
Installing collected packages: tqdm, regex, joblib, click, nltk
Successfully installed click-8.1.3 joblib-1.2.0 nltk-3.8.1 regex-2023.3.23 tqdm-4.65.0

三、nltk_data 安装

下载词库文件

wget https://gitcode.net/mirrors/nltk/nltk_data/-/archive/gh-pages/nltk_data-gh-pages.zip

unzip nltk_data-gh-pages.zip

 查看文件检索路径

import nltk
nltk.data.find(".")

把词库放到搜索路径

mkdir nltk_data

nltk_data-gh-pages/packages
cp -R nltk_data-gh-pages/packages/*  ~/nltk_data

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值