kaggle NLTK报错Resource ‘corpora/wordnet‘ not found.

文章讲述了在Kaggle上使用NLTK时遇到的关于wordnet资源未找到的错误,原因是NLTK检查的是压缩包而不是解压后的文件。通过解压wordnet.zip并将其移动到正确路径,问题得以解决。
摘要由CSDN通过智能技术生成

kaggle NLTK报错Resource 'corpora/wordnet' not found.Please use the NLTK


Downloader to obtain the resource: >>> nltk.download())

一、问题描述

在kaggle中使用
	nltk.download('wordnet')
	
	[nltk_data] Downloading package wordnet to /usr/share/nltk_data
	[nltk_data]   Package wordnet is already up-to-date!
提示wordnet已存在,但是还在报错
  Resource 'corpora/wordnet' not found.  Please use the NLTK
  Downloader to obtain the resource:  >>> nltk.download()
  Searched in:
    - '/root/nltk_data'
    - '/usr/share/nltk_data'
    - '/usr/local/share/nltk_data'
    - '/usr/lib/nltk_data'
    - '/usr/local/lib/nltk_data'

二、解决方法

我们打印下上述nltk指出的wordnet包路径下的文件

import os

for dirname, _, filenames in os.walk('/usr/share/nltk_data/corpora'):
    for filename in filenames:
        print(os.path.join(dirname, filename))

发现
在这里插入图片描述
是个压缩包

使用下面方法对wordnet.zip进行解压

!unzip /usr/share/nltk_data/corpora/wordnet.zip -d /usr/share/nltk_data/corpora/

完美解决。

所以是nltk只查询包存不存在(不管是压缩包还是解压后的),检测到压缩包存在,调用的时候没解包就出问题了。

  • 12
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值