pekseg分词模块的安装和使用问题

1.项目地址和详细安装说明

https://github.com/lancopku/pkuseg-python

2.安装和导入

pip install spacy_pkuseg
import spacy_pkuseg as pkuseg
pku_news = pkuseg.pkuseg(model_name='news', user_dict='mydic.txt',
                         postag=False)

3.常见问题

3.1.加载超时

(1)问题

加载模型时出现:ReadTimeout: HTTPSConnectionPool(host=‘github.com’, port=443): Read timed out. (read timeout=5)

(2)原因和解决办法

国内网络访问github时速度太慢。解决思路修改timeout。具体如下:根据错误提示,将安装路径下lib\site-packages\spacy_pkuseg\download.py中
def _download_url_to_file(url, dst, hash_prefix, progress):
if requests_available:
u = urlopen(url, stream=True, timeout=5)
的参数timeout=5改为timeout=50即可。

(3)类似帖子

https://blog.csdn.net/weixin_44792660/article/details/128742902

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值