知识图谱嵌入(KME)
KG嵌入技术
参考资料:
Knowledge Graph Embedding: A Survey of Approaches and Applications
https://blog.csdn.net/junruitian/article/details/87006668
https://blog.csdn.net/hy_jz/article/details/78944717
典型的KG嵌入技术通常包括三个步骤:
- 表示实体和关系
第一步指定实体和关系以连续向量表示的形式空间。实体通常表示为向量,即向量空间中的确定点。最新工作进一步考虑了实体的不确定性,并通过多元高斯分布对其建模。关系通常被视为向量空间,可以表示为向量]、矩阵、张量、多元高斯分布,甚至高斯分布的混合。 - 定义评分函数
在第二步中,在每个事实(h,r,t)/(head,relationship,tail)上定义评分函数fr(h,t),以测量其合理性。观察到的事实在公斤级中,得分往往高于未观察到的分数。 - 学习实体和关系表示
最后,为了学习这些实体和关系表示(即嵌入),第三步解决了一个优化问题,该问题最大化了观察到的事实(即,包含在D+中的事实)的总体似然性。
我们将这种嵌入技术大致分为两类:
1. 平移距离模型:基于距离的评分函数
2. 语义匹配模型:基于相似度的评分函数
算法
TransE:
【Translating Embeddings for Modeling Multi-relational Data】
- 贡献:建立简单且易拓展的模型把知识库中的实体和关系映射到低维向量空间中,从而计算出隐含的关系。
以较低的错误把实体的向量h ,t h,t连接起来,即:h + r ≈ t 。
打分函数定义为:h