概述
本文介绍了一种可以判断一个三元组 f = ( a 1 , r , a 2 ) f = (a_1, r, a_2) f=(a1,r,a2)是否为真实常识的算法
具体步骤
- 预先准备一个语料库,这个语料库里面全为已经确定的真实常识,而且我们查询的三元组 f = ( a 1 , r , a 2 ) f = (a_1, r, a_2) f=(a1,r,a2)并不在这个语料库当中。
- 在语料库当中寻找到和查询三元组 f = ( a 1 , r , a 2 ) f = (a_1, r, a_2) f=(a1,r,a2)相似的候选元组,形成候选集合。详细步骤可见原论文。
- 利用计算相似度的方法,从不同角度计算查询三元组 f = ( a 1 , r , a 2 ) f = (a_1, r, a_2) f=(a1,r,a2)与候选集和中每个候选元组的相似度。并将相似度分数从高到低排列,取前5%的 平均值作为最终相似度。
- 通过在训练集和验证集上进行实验确定最终阈值