Python 手动安装nltk数据包

自然语言处理工具包,是NLP研究领域常用的一个Python库。安装过程较为麻烦,这里记录一下。

  1. 首先安装nltk,pip install nltk
  2. 查看数据存放路径:
import nltk
from nltk.book import *

运行程序,将出现报错,同时也可以知道代码会从哪些文件夹中寻找:

Searched in:
    - 'C:\\Users\\1/nltk_data'
    - 'C:\\Users\\1\\anaconda3\\envs\\htgn\\nltk_data'
    - 'C:\\Users\\1\\anaconda3\\envs\\htgn\\share\\nltk_data'
    - 'C:\\Users\\1\\anaconda3\\envs\\htgn\\lib\\nltk_data'
    - 'C:\\Users\\1\\AppData\\Roaming\\nltk_data'
    - 'C:\\nltk_data'
    - 'D:\\nltk_data'
    - 'E:\\nltk_data'

我们从https://github.com/nltk/nltk_data下载nltk数据包,解压后,重命名为nltk_data,然后移动到上面任意的一个文件夹。

也就是将packages重命名为nltk_data
在这里插入图片描述
里面的内容:
在这里插入图片描述
然后移动到C盘:
在这里插入图片描述
测试一下:

import nltk
from nltk.book import *

输出:

*** Introductory Examples for the NLTK Book ***
Loading text1, ..., text9 and sent1, ..., sent9
Type the name of the text or sentence to view it.
Type: 'texts()' or 'sents()' to list the materials.
text1: Moby Dick by Herman Melville 1851
text2: Sense and Sensibility by Jane Austen 1811
text3: The Book of Genesis
text4: Inaugural Address Corpus
text5: Chat Corpus
text6: Monty Python and the Holy Grail
text7: Wall Street Journal
text8: Personals Corpus
text9: The Man Who Was Thursday by G . K . Chesterton 1908
>>> from nltk.corpus import brown
>>> print(brown.words()[0:10])
['The', 'Fulton', 'County', 'Grand', 'Jury', 'said', 'Friday', 'an', 'investigation', 'of']
  • 2
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值