金庸小说人物知识图谱构建——人名提取

本步的思路是运用命名实体识别工具来提取小说中的人名

我用的工具是stanfordcorenlp,当然还有其他的工具可以选择,如snownlp,THULAC等,我将提取的人名保存在txt文件中,经过人工去错后,得到如下人名:

《雪山飞狐》部分人名

提取人名的代码如下

#写入txt文件
from stanfordcorenlp import StanfordCoreNLP

nlp = StanfordCoreNLP(r'D:\java\stanford-corenlp-4.2.2', lang='zh')

with open(
  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
知识图谱是一种用于描述实体之间关系的图形化知识表示方式。Python是一种功能强大的编程语言,可以用于构建知识图谱。以下是使用Python构建知识图谱的一些步骤和方法: 1. 确定实体和关系:首先需要确定知识图谱中包含哪些实体和它们之间的关系。例如,在金庸小说中,实体可以是人物、地点、事件等,它们之间的关系可以是亲戚关系、师徒关系、敌对关系等。 2. 数据收集和处理:收集和处理数据是构建知识图谱的重要步骤。可以使用Python爬虫技术从互联网上收集数据,也可以使用Python处理已有的数据。例如,可以使用Python的pandas库对数据进行清洗和处理。 3. 知识图谱建模:使用Python的图数据库neo4j可以方便地构建知识图谱。可以使用Python的py2neo库连接neo4j数据库,并使用Cypher语言创建节点和关系。例如,可以使用以下代码创建一个人物节点和一个师徒关系: ```python from py2neo import Graph, Node, Relationship # 连接neo4j数据库 graph = Graph() # 创建人物节点 person = Node("Person", name="张无忌") graph.create(person) # 创建师徒关系 master = Node("Person", name="张三丰") apprentice = person relationship = Relationship(master, "师徒", apprentice) graph.create(relationship) ``` 4. 可视化:使用Python的可视化库可以将知识图谱可视化。例如,可以使用Python的matplotlib库绘制知识图谱的节点和关系。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值