【TransE模型】基于分布式表示推理

最新推荐文章于 2025-03-28 10:30:04 发布

Minor0218

最新推荐文章于 2025-03-28 10:30:04 发布

阅读量1.4k

点赞数

文章标签：人工智能自然语言处理 python

本文链接：https://blog.csdn.net/Minor0218/article/details/126310776

版权

TransE [ Bordes et al., 2013] 是最具代表性的位移距离模型，其核心思想是实体和关系间的位移假设：三元组中头实体向量表示h与关系的向量表示r之和与尾实体向量表示 t越接近越好，即 h + r ≈ t

TransE基于实体和关系的分布式向量表示，将每个三元组实例（head，relation，tail）中的关系relation看做从实体head到实体tail的翻译，通过不断调整h、r和t（head、relation和tail的向量），使（h + r）尽可能与 t 相等，即 h + r = t。
代码的实现：

项目数据采用FB15数据集实现TransE模型，代码来源：https://github.com/Anery/transE

实体数据：entity2id，第一列为实体名字，第二列为实体ID

关系数据：relation2id，第一列为关联名字，第二列为关系ID

（h,t,r）数据，包括三列，第一列H实体名字，第二列T实体名字，第三列R关系名字。分为训练集，验证集和测试集

首先，TransE模型采用k维随机均匀分布对每个实体和每个关系进行向量初始化
然后，批训练数据集构建，从训练集中随机选出正面样本（h,r,t），然后基于正面样本，保持正面样本中h，r或r，t不变，改变t或h，获得负面样本，合并一起构成批训练数据集。
表示向量更新，采用随机梯度下降法，对批训练数据集中正面样本（h,r,t）和负样本的向量表示进行更新。update_embeddings函数中，要对correct triplet和corrupted triplet都进行更新（因为不同时替换头尾实体，所以在每步更新时重叠的实体要更新两次）
TranE直接对向量表示进行训练，每个实体（head或tail）对应一个k维向量，每个关系对应一个k维向量，所有的k维向量即为TransE模型的参数，需要训练的参数。

TransE模型训练：