spacy和en安装

参考:https://www.zhihu.com/question/56095738/answer/283999308
安装spacy en_core_web_sm报错
raise ConnectionError(e, request=request)
requests.exceptions.ConnectionError: HTTPSConnectionPool(host=‘raw.githubusercontent.com’, port=443): Max retries exceeded with url: /explosion/spacy-models/master/shortcuts-v2.json (Caused by NewConnectionError(’<urllib3.connection.VerifiedHTTPSConnection object at 0x000001E8885F8BA8>: Failed to establish a new connection: [Errno 11004] getaddrinfo failed’,))
无论是装spacy还是en的库都会报这个错(anaconda prompt)。。。后来用pycharm装上了spacy(2.3.0),也用同样方法装了en, en_core_web_sm之类,但是还是会报错:no module named en

后来我从github上通过pip安装en_core_web_sm,由于我没有找到2.3.0版本,只能装了2.1.0
pip --default-timeout=10000 install https://github.com/explosion/spacy-models/releases/download/en_core_web_sm-2.1.0/en_core_web_sm-2.1.0.tar.gz
在这里插入图片描述
然而:
在这里插入图片描述
似乎是在说版本不对应。。。。,而且pycharm依然报错No module named ‘en’
可算让我给找着了:https://github.com/explosion/spacy-models/releases/tag/en_core_web_sm-2.3.0
在这里插入图片描述

pip --default-timeout=10000 install https://github.com/explosion/spacy-models/releases/download/en_core_web_sm-2.3.0/en_core_web_sm-2.3.0.tar.gz

安装
在这里插入图片描述
测试:

import spacy
spacy.load("en_core_web_sm")

在这里插入图片描述
使用,参考:https://blog.csdn.net/lrt366/article/details/90269582
注意,在torchtext中使用spacy时,由于field的默认属性是tokenizer_language=‘en’

TEXT = torchtext.data.Field(tokenize='spacy',  tokenizer_language='en_core_web_sm')

另附安装en_core_web_md的方式:

pip --default-timeout=10000 install https://github.com/explosion/spacy-models/releases/download/en_core_web_md-2.3.0/en_core_web_md-2.3.0.tar.gz
  • 6
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值