K-BERT：BERT+知识图谱

最新推荐文章于 2024-09-09 16:08:58 发布

AI强仔

最新推荐文章于 2024-09-09 16:08:58 发布

阅读量1.9k

点赞数 1

分类专栏：人工智能 Attention 文章标签： bert 知识图谱自然语言处理

人工智能同时被 2 个专栏收录

150 篇文章

订阅专栏

Attention

6 篇文章

订阅专栏

1 简介

本文根据2019年《K-BERT：Enabling Language Representation with Knowledge Graph》翻译总结的。如标题所述就是BERT+知识图谱。

本文贡献如下：
1）我们介绍了一个知识集成的语言表达模型，取名K-BERT。其兼容BERT，同时可以融合专有领域知识。解决了Heterogeneous Embedding Space（HES，多样化的Embedding空间）和Knowledge Noise (KN)问题。HES指文本中词语的embedding 向量和知识图谱中实体的embedding 向量因为他们获取的方式不一样，导致向量空间不一致。KN指太多的知识融合可能使语句偏离其正确的意思。
2）因为知识图谱的参与，K-BERT不仅在专有领域的表现超过BERT，同时在一些开发领域也有很好的表现。
3） K-BERT代码和我们自己开发的知识图谱已开源，地址：https://github.com/ autoliuweijie/K-BERT.

2 K-BERT方法

如下图所示，K-BERT包含四部分：knowledge layer, embedding layer, seeing layer、mask-transformer。下面分别论述。
在这里插入图片描述

2.1 knowledge layer

主要就是引入知识图谱，将句子转换成句子树（带有分支的）。如下图：
在这里插入图片描述

以及模型中的示例，如下图，Cook是apple公司的CEO，这个分支是来自于知识图谱。：
在这里插入图片描述

2.2 embedding layer

如下图,embedding有三部分，1）token embedding，2）位置embedding（采用的是soft-position，如下图红色数字部分，每个分支都编码了），3）segment embedding（如只有一个语句就都标成A，如果两个语句就表示成 {A, A, A, A, …, A, B, B, …, B}.）
在这里插入图片描述