python Name Entity Recognition(NER) extract company name 命名实体识别 提取公司名

命名实体识别(NER)可能是信息提取的第一步,该过程旨在将文本中的命名实体定位和分类为预定义类别,例如人员名称,组织,位置,时间表达,数量,货币价值,百分比,等等。NER在自然语言处理(NLP)的许多领域中使用,它可以帮助回答许多现实世界中的问题,例如:
新闻中提到了哪些公司?
在投诉或评论中是否提到了特定产品?
该推文中是否包含一个人的名字?该推文中是否包含此人的位置?

1.安装相应依赖

pip3 install stanza

# ModuleNotFoundError: No module named '_lzma'
pip3 install backports.lzma

# vim /usr/local/python3/lib/python3.xxx/lzma.py

# 修改
try:
    from _lzma import *
    from _lzma import _encode_filter_properties, _decode_filter_properties
except ImportError:
    from backports.lzma import *
    from backports.lzma import _encode_filter_properties, _decode_filter_properties

2.实现中,英文公司名提取
import stanza

stanza.download('en')
# stanza.download('zh')
nlp = stanza.Pipeline(lang='en', processors='tokenize,ner')
# nlp = stanza.Pipeline(lang='zh', processors='tokenize,ner')
# doc = nlp("©1999-2021北京创新乐知网络技术有限公司版权与免责声明")
doc = nlp("Copyright © 2020-2021 Contemporary Amperex Technology Co., Limited. All Rights Reserved.闽ICP备14008486号-3")
print(*[f'entity: {ent.text}\ttype: {ent.type}' for ent in doc.ents], sep='\n')

在这里插入图片描述
在这里插入图片描述

参考:https://stanfordnlp.github.io/stanza/ner.html

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Cocktail_py

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值