基于spacy的实体抽取工具

环境要求

1.安装spacy包

pip install spacy -i https://pypi.tuna.tsinghua.edu.cn/simple

2.安装spacy模型

中文模型比如:zh_core_web_sm

如果采用命令行python -m spacy download zh_core_web_sm进行安装,会因为连接问题下载失败,建议利用zh_core_web_sm-3.3.0.tar.gz解压后的文件夹进行本地安装

在文件目录下打开虚拟环境,运行命令python setup.py install进行本地安装

spacy实体抽取demo

import spacy
model = spacy.load('zh_core_web_sm')  # 加载模型
entities = []
doc = model('【郑渝高铁首发,南阳日报社记者带你沿线游】#郑渝高铁 现代化“副中心”建设新支撑# #郑渝高铁全线贯通# #郑渝高铁开通首发# 6月20日上午的在郑渝高铁首发车上,省人大代表马金霞接受南阳日报社记者采访。')
for entity in doc.ents:
    entities.append(str(entity) + ':' + str(entity.label_))
print(entities)
# 实体抽取结果:['南阳日报社:ORG', '高铁:ORG', '6月20日上午:TIME', '郑渝高铁:FAC', '省人大:ORG', '马金霞:PERSON', '南阳日报社:ORG']

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值