spacy库的安装与使用_python spacy库使用总结【待完善】

spacy库的使用说明1.安装2.用法2.1 word tokenize(doc: token)2.2 英文断句(doc.sents: sent)2.3 词干化(doc: token, token_lemma_, token_lemma)2.4 词性标注(doc: token,token.pos_,token.pos)2.5 命名实体识别(doc.ents:ent, ent.label_, ent...
摘要由CSDN通过智能技术生成

spacy库的使用说明

1.安装

2.用法

2.1 word tokenize(doc: token)

2.2 英文断句(doc.sents: sent)

2.3 词干化(doc: token, token_lemma_, token_lemma)

2.4 词性标注(doc: token,token.pos_,token.pos)

2.5 命名实体识别(doc.ents:ent, ent.label_, ent.label)

2.6 名词短语提取(doc.noun_chunks)

2.7 基于词向量计算两个单词的相似度 (doc[index_i].similarity(doc[index_j]))

1.安装

见另一篇python spacy安装问题末尾总结。

2.用法

spaCy 是一个Python自然语言处理工具包,诞生于2014年年中,号称“Industrial-Strength Natural Language Processing in Python”,是具有工业级强度的Python NLP工具包。spaCy里大量使用了 Cython 来提高相关模块的性能,这个区别于学术性质更浓的Python NLTK,因此具有了业界应用的实际价值。

import spacy

nlp = spacy.load(en_core_web_em)

官方文档见spacy(https://spacy.io/usage/linguistic-features)

主要支持英语和德语。

功能包括word tokenize, 英文断句,词干化,词性标注,命名实体识别,名词短语提取,相似度计算……

2.1 word tokenize(doc: token)

将英文单词和标点符号都分离出来,如果含有中文,则中文以多个文字之间的空格分词。

In [3]: test_doc = nlp(u"it's word tokenize test for spacy")

In [4]: print(test_doc)

it's word tokenize test for spacy

In [5]: for token in test_doc:

print(token)

...:

it

's

word

tokenize

test

for

spacy

test_doc是 spacy.tokens.doc.Doc 对象。

2.2 英文断句(doc.sents: sent)

In [6]: test_doc = nlp(u'Natura

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
当你在运行 "python -m spacy download en_core_web_sm" 命令时出现 "connection error" 错误,意味着你的计算机无法连接到Spacy的下载服务器。这可能是因为你的计算机无法访问互联网或Spacy服务器出现问题。 首先,确保你的计算机连接到可稳定的互联网连接。你可以尝试打开其他网页或应用程序来确定互联网连接是否正常。 如果你的互联网连接正常,但仍然遇到 "connection error" 错误,那么这可能是Spacy服务器出现问题。你可以稍后再次尝试下载,或者尝试从其他源下载所需的Spacy模型。 此外,你还可以尝试使用以下命令来下载en_core_web_sm模型的压缩文件,然后手动安装: 1. 打开Spacy的模型目录: - 在命令行中运行"python"进入Python解释器 - 运行以下代码: ```python import spacy print(spacy.__file__) ``` - 输出将显示Spacy安装路径,其中一个子目录名为"models"或"models-xx"。 2. 打开Spacy的模型目录,并进入子目录,如"models/en_core_web_sm"。 3. 下载en_core_web_sm模型的压缩文件: - 在浏览器中访问 https://github.com/explosion/spacy-models/releases - 在该页面上找到en_core_web_sm模型的最新版本,并下载对应的.zip文件。 4. 将下载的压缩文件解压到模型目录中,确保解压后的文件夹名称为"en_core_web_sm"。 5. 打开命令行,并使用以下命令创建一个链接来识别该模型: ``` python -m spacy link [模型目录的绝对路径] [模型名称] ``` 经过上述步骤,你应该能够手动下载并安装en_core_web_sm模型,从而解决"connection error"错误。如果问题仍然存在,请确保你的计算机和Spacy工具的版本兼容,并尝试联系Spacy的支持团队以获取更多帮助。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值