pyltp实体识别_利用pyltp进行实体识别

1 #-*- coding: utf-8 -*-

2 importos3 from pyltp importSegmentor, Postagger, Parser, NamedEntityRecognizer4 from collections importOrderedDict5

6 classLtpParser():7 def __init__(self):8 LTP_DIR = "../ltp_model"

9 self.segmentor =Segmentor()10 self.segmentor.load_with_lexicon(os.path.join(LTP_DIR, "cws.model"), os.path.join(LTP_DIR, "word_dict.txt")) #加载外部词典

11

12 self.postagger =Postagger()13 self.postagger.load_with_lexicon(os.path.join(LTP_DIR, "pos.model"), os.path.join(LTP_DIR, "n_word_dict.txt")) #加载外部词典

14

15 #self.parser = Parser()

16 #self.parser.load(os.path.join(LTP_DIR, "parser.model")) #依存句法分析

17

18 self.recognizer =NamedEntityRecognizer()19 self.recognizer.load(os.path.join(LTP_DIR, "ner.model"))#实体识别

20

21 ##加载停词

22 #with open(LTP_DIR + '/stopwords.txt', 'r', encoding='utf8') as fread:

23 #self.stopwords = set()

24 #for line in fread:

25 #self.stopwords.add(line.strip())

26

27 '''把实体和词性给进行对应'''

28 defwordspostags(self, name_entity_dist, words, postags):29 pre = ' '.join([item[0] + '/' + item[1] for item inzip(words, postags)])30 post =pre31 for et, infos inname_entity_dist.items():32 ifinfos:33 for info ininfos:34 post = post.replace(' '.join(info['consist']), info['name'])35 post = [word for word in post.split(' ') if len(word.split('/')) ==

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值