为了防止自己忘记,记录一下
【关于安装报错】
参考博文:关于使用synonyms报错SYNONYMS_DL_LICENSE is not in Environment variables的解决办法-CSDN博客
Python第三方库synonyms近义词词库报错403,缺少这个文件,文末下载_synonyms库-CSDN博客
下载好word.vector.gz文件之后,需要注意的是,如果是新创建的虚拟环境,要将这个文件放到虚拟环境下的synonyms\data文件夹里!!!!,D------Anaconda\envs\EDA_nlp\Lib\site-packages\synonyms\data(这是我的路径,前面省略了一点) 之前一直忽略这个问题,所以即使放进去了也还是报同样的错误。
找自己虚拟环境路径的方法,参考博文如何查看 ananconda 的环境(虚拟环境)安装包位置_ubuntu本地anaconda虚拟环境怎么查看-CSDN博客
【关于运行显示编码错误】
报错问题:File "D:\EDA4Chinese\eda_aug\eda.py", line 13, in __init__ self.get_stopwords() File "D:\EDA4Chinese\eda_aug\eda.py", line 21, in get_stopwords for line in f.readlines(): UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 4: illegal multibyte sequence
这里我打开了 D:\EDA4Chinese\eda_aug\eda.py文件,然后看到代码,由于计算机默认的是gbk解读,而stopwords的文件编码方式是UTF-8,所以对代码进行修改

改成下面这样,就可以成功运行了

本文讲述了在安装Python第三方库synonyms时遇到的SYNONYMS_DL_LICENSE错误,以及如何在新虚拟环境中正确放置词库文件。同时,作者还分享了解决运行时编码错误,将gbk编码转换为UTF-8的经验。
818

被折叠的 条评论
为什么被折叠?



