首先当然是 pip install spacy
了,我这里是3.06,然后需要下载对应的语言模型,模型对应的版本要求在这个页面看: https://github.com/explosion/spacy-models/releases
其中的名字 en_core_web_{sm, md, lg}是模型大小,我下载的是lg
然后python -m spacy download en_core_web_lg
这样下载是不行的,安装en_core_web_lg的方式是pip install https://github.com/explosion/spacy-models/releases/download/en_core_web_lg-3.0.0/en_core_web_lg-3.0.0.tar.gz
这个对应的spacy的版本必须是3.0-3.1之间
使用spacy.load()函数来加载语言模型,spacy.load(name,disable)
其中,name参数是语言模型的名词,disable参数是禁用的处理管道列表,例如,创建en_core_web_lg语言模型,并禁用ner,下载之后导入方式为:nlp = spacy.load("en_core_web_lg", disable=['ner'])
对于3.x版本,直接nlp = spacy.load("en_core_web_lg")
导入
对于2.x版本,对于多个包,如果你同时有en_core_web_lg和en_core_web_sm,那么就得把你想用的包连接到对应的语言,方式为python -m spacy link en_core_web_sm en
,这样之后导入的方式就变为了spacy.load("en")