人物关系提取

最新推荐文章于 2024-05-16 01:33:04 发布

ITzqdn

最新推荐文章于 2024-05-16 01:33:04 发布

阅读量2.7k

点赞数 1

本文链接：https://blog.csdn.net/ITzqdn/article/details/79505879

版权

import os,sys

import jieba, codecs, math

import jieba.posseg as pseg

names = {} #姓名字典

relationships = {} #关系字典

lineNames = [] #每段内人物关系

jieba.load_userdict("dict.txt") #加载字典

with codecs.open("busan.txt","r","utf8") as f:

    for line in f.readlines():#读取文件所有东西，每行作为列表的一个元素

        poss = pseg.cut(line)#分词并返回该词词性

        lineNames.append([])#为新读入的一段添加人物名称列表

        for w in poss:

            if w.flag != "nr" or len(w.word)<2:

                continue

            #当分词长度小于2或该词词性不为nr时认为该词不为人名

            lineNames[-1].append(w.word)

            #为当段的环境增加一个人物

            if names.get(w.word) is None:

                na

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

ITzqdn

关注关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
人物关系提取

import os,sysimport jieba, codecs, mathimport jieba.posseg as psegnames = {} #姓名字典relationships = {} #关系字典lineNames = [] #每段内人物关系jieba.load_userdict("dict.txt") #加载字典with codecs.open("busan.txt","r","...
复制链接

扫一扫