标签类目 知识图谱_知识图谱学习(六)

1、知识挖掘
知识挖掘是指从数据中获取实体及新的实体链接和新的关联规则等信息。主要的技术包含实体的链接与消歧、知识规则挖掘、知识图谱表示学习等。其中实体链接与消歧为知识的内容挖掘,知识规则挖掘属于结构挖掘,表示学习则是将知识图谱映射到向量空间而后进行挖掘
1)实体,链接
2)规则
3)图谱表示学习2、基于生成模型的 entity-mention 模型


文字表述为: 我们有两个句子,其中的实体分别为 Jordan(左)和 Michael Jordan(右),我们称之为Mention。
我们要做的事情,简单来说就是根据mention所处的句子和上下文来判断该mention是某一实体的概率。

3、构建实体关联图

实体关联图由3个部分组成:
* 每个顶点 Vi=<mi,ei> 由mention-entity构成。
* 每个顶点得分:代表实体指称mi的目标实体为ei概率可能性大小。
* 每条边的权重:代表语义关系计算值,表明顶点Vi和Vj的关联程度。
其示例如上图所示,其流程包括:1)顶点的得分初始化方法、2)边权初始化方法 3)基于图的标签传播算法。

1)顶点的初始化
若顶点V实体不存在歧义,则顶点得分设置为1;
若顶点中mention和entity 满足 p(e|m)≤, 则顶点得分也设置为1.
其余顶点的得分设置为 p(e|m);

2)边的初始化 : 深度语义关系模型
其大体流程如下图所示:


其中E 表示实体, R表示关系, ET表示实体类型,D表示词。它做的是将这些东西映射到非常稀疏的空间内,而后通过深度学习进行特征提取和标注,最终给出每对实体键值对的分值。

3)基于图的标签传播算法
初始时,数据中的标签如左侧表格所示:


其中标签数据为无歧义的entity-mention,基于此数据,我们采用基于图的标签传播算法,先构造一个相似度矩阵,而后采用图的regulartion,直到最终标签确定。有点类似于协同消歧的作用。
【从2)提取相似度矩阵,计算结果,得到没标注的数据的归属标签】

4、示例三:基于知识库


其流程图如上图所示,
1)首先我们有一个知识库,我们经由深度学习算法,将RDF三元组转化为实体向量。
2)录入文本
3)提取文本的实体集,计算实体向量间的相似度。
4)基于相似度构建实体关联图。
5)基于PageRank算法更新实体关联图。

部分详细说明:

4)基于向量相似度的实体关联图的构建

5)基于PageRank得分
首先根据PageRank算法计算未消歧实体指称实体的得分,取得分最高的未消歧实体。而后删除其他候选实体及相关的边,更新图中的边权值。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值