python:spacy、gensim库的安装遇到问题及bug处理

1.spacy

SpaCy最新版V3.0.6版,在CMD 模式下可以通过

pip install spacy -U
进行安装

注意这个过程进行前可以先卸载之前的旧版本

pip uninstall spacy

如果安装失败可以,在以下地址下载对应的轮子

https://www.lfd.uci.edu/~gohlke/pythonlibs/

ctrl+F查找对应python版本的wheel,注意安装错版本了

https://www.lfd.uci.edu/~gohlke/pythonlibs/#spacy

由于我的电脑是windows系统64位的,python是3.80版,所以我选择了第二个。CP38就是3.8版本,win表求windows系统,amd64表求64位。

下载到轮子以后,到到这个轮子所在的目录,在目录地址栏打上cmd,进入后

pip install G:\spacy-3.0.6-cp38-cp38-win_amd64.whl

安装spacy完后就要根据对应的spacy版本安装对应的语言解析包了。这里语言包必须和spacy版本一致,否则会出现这里的错误:https://blog.csdn.net/qq_43965708/article/details/114028746

语言包主要是下载中文和英文的,如果通过pip install en_core_web_sm 安装不成功的话,最好离线安装。方法还是:pip install + 安装的文件名,如下图

 1.1 解决python -m spacy download en_core_web_sm连接不上服务器的方案

参考这个链接解决:

解决python -m spacy download en_core_web_sm连接不上服务器的方案_Fitz1318的博客-CSDN博客

1.2:OSError: [E053] Could not read config.cfg from C:\Users\pc\AppData\Local\Programs\Python\Python38\Li

OSError: [E053] Could not read config.cfg from C:\Users\pc\AppData\Local\Programs\Python\Python38\Li_Dream丶Killer的博客-CSDN博客

经网上查找发现出现这个问题的原因是:下载的en_core_web_mdspacy的版本不兼容,我使用的en_core_web_md版本是2.2.5,但是安装spacy最新的版本是3.0.0。
因此我把spacy卸载后,重装spacy2.x的版本。

pip uninstall spacy

pip install -i https://pypi.douban.com/simple spacy==2.2.2

1.3:Spacy的依存分析:安装zh_core_web_md、zh_core_web_trf

上次使用spacy时,官网提供的中文模型有zh_core_web_smzh_core_web_md 和 zh_core_web_lg,现在发现又提供了一种 zh_core_web_trf

Spacy的依存分析_Dawn_www的博客-CSDN博客_spacy 依存句法分析

在Jupyter Notebook中使用spaCy可视化中英文依存句法分析结果 - 知乎

1.4 出现no module named ‘spacy‘

可以参考:

No module named en 的解决办法spacy_加油当当的博客-CSDN博客

ImportError: No module named ‘spacy.en‘_上课不要摸鱼江的博客-CSDN博客

我个人遇到问题可能是无法读取文件目录下的文件,只需要放到同一目录即可:

 和main文件放在同级目录下就没有报错了,可能是因为我import spacy在子文件问题吧

2.gensim

安装gensim报错:

2.1:安装gensim失败,error: Microsoft Visual C++ 14.0 or greater is required

原因:

用pip去安装一些第三方包的时候会出现如下错误,缺少C++编译器,因为有些程序需要使用,没有C++接口会报错,

解决方案:

根据报错提示:

error: Microsoft Visual C++ 14.0 or greater is required. Get it with "Microsoft C++ Build Tools": https://visualstudio.microsoft.com/visual-cpp-build-tools/
Microsoft C++ 生成工具 - Visual Studio【点击】

1.先去VScode安装C/C++:

2.根据这个下载了最新的 Visual Studio 2019

一般前两个就够了 

3.安装完后重启电脑,然后重新使用pip安装包就可以了

4.成功安装如下:

### Spacy 安装失败解决方案 对于Ubuntu系统下的Anaconda环境,如果遇到Spacy安装失败的情况,特别是当尝试通过`pip install en_core_web_sm`命令安装英文语言包时出现E11004错误(Failed to establish a new connection),可以采取以下措施来解决问题[^3]。 #### 方法一:离线安装 由于网络连接问题可能导致在线安装失败,建议从官方资源获取离线安装文件。前往[spaCy Models](https://spacy.io/models/en)页面下载对应版本的语言模型压缩包。之后,在本地终端执行如下Python代码完成安装: ```bash python -m spacy download en_core_web_sm-3.2.0.tar.gz --direct ``` 注意替换上述链接中的具体路径为你实际保存的位置,并确保文件名匹配所选版本号。 #### 方法二:更新或重置镜像源 有时国内用户可能会因为访问国外服务器速度慢而导致超时中断等问题。此时可考虑切换至清华大学TUNA或其他国内开源软件镜像站作为临时性的Pypi索引地址来进行快速安装操作: ```bash pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple/ pip install spacy python -m spacy download en_core_web_sm ``` 最后记得恢复默认配置以免影响其他项目的依赖管理工具正常工作。 #### 方法三:处理版本兼容性 确认当前使用的Python解释器版本是否满足目标的要求;同时也要留意不同版本之间可能存在API变更带来的潜在风险。可以通过指定确切的版本号来规避此类隐患: ```bash conda create -n nlp_env python=3.8 source activate nlp_env pip install "spacy>=2,<3" ``` 以上方法能够有效应对大部分场景下的Spacy及其相关组件安装过程中可能出现的各种异常状况。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

汀、人工智能

十分感谢您的支持

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值