基于排序学习与信息新颖性增强的实体推荐算法
1.已有算法的主要问题
- 先对查询进行分类再进行实体推荐。
缺乏通用性,需要针对不同类型构建不同特征。
2.实体排序
- 基于信息新颖性。
相关度,兴趣度和意外度。其中兴趣度至关重要。贡献:兴趣度>意外度>相关度。
离线评价指标:
DCG:假设我们现在在Google上搜索一个词,然后得到5个结果。我们对这些结果进行3个等级的区分:Good(好)、Fair(一般)、Bad(差),然后赋予他们分值分别为3、2、1,假定通过逐条打分后,得到这5个结果的分值分别为3、2 、1 、3、 2。
MRR(Mean Reciprocal Rank):是把标准答案在被评价系统给出结果中的排序取倒数作为它的准确度,再对所有的问题取平均。
基于深度多任务学习的上下文相关实体推荐模型
1.引入搜索回话中的的前序查询序列可以显著提升效果
2.借助于上下文相关文档辅助查询
基于卷积神经网络
1.借助于点击日志自动构建大规模训练数据
2.基于卷积神经网络的文档对排序
基于卷积神经网络的文档对排序
基于统计机器翻译模型的实体推荐理由生成
实体推荐理由生成
输入:实体e以及描述句子sent
目标:生成自然语言描述
在生成过程中引入实体信息