learning to rank 学习排名系统综述

stay_foolish12

已于 2023-11-16 13:39:06 修改

阅读量417

点赞数

文章标签：学习

于 2023-11-16 13:38:54 首次发布

本文链接：https://blog.csdn.net/stay_foolish12/article/details/134434818

版权

在这里插入图片描述

Learning to Rank 的实践

文档列表方法
Listwise 算法相对于 Pointwise 和 Pairwise 方法来说，它不再将排序问题转化为一个分类问题或者回归问题，而是直接针对评价指标对文档的排序结果进行优化，如常用的 MAP、NDCG 等。应用 Listwise 的模型有 ListNet、ListMLE、SVM MAP、AdaRank、SoftRank、LambdaRank、LambdaMART。其中 LambdaMART（对 RankNet 和 LambdaRank 的改进）在 Yahoo Learning to Rank Challenge 表现出最好的性能。

在这里插入图片描述

该方法特定Query，文档集合，输出所有文档的打分或者排列顺序。评价指标如 NDCG、MAP 等。由于此种方法是针对评价指标直接进行优化，所以它往往表现出不错的效果。

在这里插入图片描述
在训练阶段输入是n个query对应的doc集合，通常数据来源有两种，一种是人工标注，即通过对实际系统中用户query返回的doc集合进行相关性标注，标签打分可以是三分制（相关，不相关，弱相关），也可以是更细的打分标准。另外一种是点击日志中获取，通过对一段时间内的点击信息进行处理获得优质的点击数据。这些输入的doc的表示形式是多个维度的特征向量，特征的设计也尤其重要，对网页系统检索而言，常用的有查询与文档匹配特征，其中细化了很多角度的匹配，比如紧密度匹配，语义匹配，精准匹配等等，还有通过将文档分为不同域后的各个域的匹配特征，关键词匹配特征，bm系列特征, 以及通过dnn学习得到的端到端的匹配特征。对各个垂直领域比如图像搜索而言，在网页搜索特征的基础上，需要利用图片相关性特征，图片标签等一系列垂直特征去加强学习效果。