TransE、TransH模型都是图谱中关于实体嵌入的模型,它们都是基于向量平移的模型。
它们的目的是使 h+r=t,所以它们的损失函数是比较h+r和t之间的距离,目的是使所有三元组的h+r与t的距离之和最小,我们可以定义h+r与t之间的距离是
d(h+r, t) = L(h+r-t)
L可以是一范数也可以是二范数
但是表示学习没有明确的可以监督的地方(就是不像有些数据有lable可以用来判断模型的结果正确与否,并以此来设计损失函数),虽然我们有损失函数了,但那只是都往正确的方向训练,要是加入了负样本,可以大大提高学习的质量。
加入负样本就是采用了负采样的方法,人为的创建负样本,加入了负样本后,我们就希望正样本的损失最小,而负样本的损失最大。
损失函数就变成了
min(L(h+r-t) - L(h’+r-t’))
下面是具体的tanse算法
它的损失函数是
注意这里的d()使用的是二范数,但是它没有开平方。
这个损失函数也叫合页损失函数,+代表max(0, loss),y叫ma
对TransE、TransH模型的理解
最新推荐文章于 2024-05-20 17:27:41 发布