关于synonyms安装报错Exception: SYNONYMS_DL_LICENSE is not in Environment variables以及编码错误

本文讲述了在安装Python第三方库synonyms时遇到的SYNONYMS_DL_LICENSE错误,以及如何在新虚拟环境中正确放置词库文件。同时,作者还分享了解决运行时编码错误,将gbk编码转换为UTF-8的经验。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

为了防止自己忘记,记录一下

【关于安装报错】

参考博文:关于使用synonyms报错SYNONYMS_DL_LICENSE is not in Environment variables的解决办法-CSDN博客

Python第三方库synonyms近义词词库报错403,缺少这个文件,文末下载_synonyms库-CSDN博客 

下载好word.vector.gz文件之后,需要注意的是,如果是新创建的虚拟环境,要将这个文件放到虚拟环境下的synonyms\data文件夹里!!!!,D------Anaconda\envs\EDA_nlp\Lib\site-packages\synonyms\data(这是我的路径,前面省略了一点) 之前一直忽略这个问题,所以即使放进去了也还是报同样的错误。

找自己虚拟环境路径的方法,参考博文如何查看 ananconda 的环境(虚拟环境)安装包位置_ubuntu本地anaconda虚拟环境怎么查看-CSDN博客

【关于运行显示编码错误】

报错问题:File "D:\EDA4Chinese\eda_aug\eda.py", line 13, in __init__ self.get_stopwords() File "D:\EDA4Chinese\eda_aug\eda.py", line 21, in get_stopwords for line in f.readlines(): UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 4: illegal multibyte sequence

这里我打开了 D:\EDA4Chinese\eda_aug\eda.py文件,然后看到代码,由于计算机默认的是gbk解读,而stopwords的文件编码方式是UTF-8,所以对代码进行修改

改成下面这样,就可以成功运行了

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值