原生流程组件
流程是依次定义在模型的meta.json文件里面的,原生组件需要二进制数据来进行预测;
- 函数用来读取一个doc,修改并且返回它
- 可以利用
nlp.add_pipe
来添加组件
def custom_component(doc):
#deal with doc
return doc
nlp.add_pipe(custom_component)
设置定制化属性
通过._
属性来读取
doc._.title = "My document"
token._.is_color = True
span._.has_color = True
使用set_extension
方法在全局Doc,Token或Span上注册;
from spacy.tokens import Doc, Token, Span
Doc.set_extension("title", default=None)
Token.set_extension("is_color", default=False)
Span.set_extension("has_color", default&