排序学习 Learning to Rank(LTR),简单通俗易懂

最新推荐文章于 2024-04-22 18:39:35 发布

Ai君臣

最新推荐文章于 2024-04-22 18:39:35 发布

阅读量1.5k

点赞数 1

分类专栏： NLP 文章标签： LTR rank 相似度

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/liuchenbaidu/article/details/108126858

版权

NLP 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

排序学习是推荐、搜索、广告的核心方法。排序结果的好坏很大程度影响用户体验、广告收入等。排序学习可以理解为机器学习中用户排序的方法，这里首先推荐一本微软亚洲研究院刘铁岩老师关于LTR的著作，Learning to Rank for Information Retrieval，还有李航的Learning to Rank for Information Retrieval and Natural Language Processing 链接https://www.iro.umontreal.ca/~nie/IFT6255/Books/Learning-to-rank.pdf

常用的排序学习分为三种类型：PointWise，PairWise和ListWise。也就是训练数据的格式，单文档，双文档，列表文档。

1.PointWise

方法学习到全局的相关性，并不对先后顺序的优劣做惩罚。

2.PairWise

对于搜索系统来说，系统接收到用户査询后，返回相关文档列表，所以问题的关键是确定文档之间的先后顺序关系。单文档方法完全从单个文档的分类得分角度计算，没有考虑文档之间的顺序关系。文档对方法将排序问题转化为多个pair的排序问题，比较不同文章的先后顺序。没有考虑位置关系。

但是文档对方法也存在如下问题：

文档对方法考虑了两个文档对的相对先后顺序，却没有考虑文档出现在搜索列表中的位置，排在搜索结果前面的文档更为重要，如果靠前的文档出现判断错误，代价明显高于排在后面的文档。
同时不同的査询，其相关文档数量差异很大，所以转换为文档对之后，有的查询对能有几百个对应的文档对，而有的查询只有十几个对应的文档对，这对机器学习系统的效果评价造成困难

3.ListWise:

单文档方法将训练集里每一个文档当做一个训练实例，文档对方法将同一个査询的搜索结果里任意两个文档对作为一个训练实例，文档列表方法与上述两种方法都不同，ListWise方法直接考虑整体序列，针对Ranking评价指标进行优化。比如常用的MAP, NDCG

但是呢，一般竞赛呀，语料一般还是以文档对的形式组织，比较容易标语料吧。

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
1
评论
排序学习 Learning to Rank(LTR),简单通俗易懂

排序学习是推荐、搜索、广告的核心方法。排序结果的好坏很大程度影响用户体验、广告收入等。排序学习可以理解为机器学习中用户排序的方法，这里首先推荐一本微软亚洲研究院刘铁岩老师关于LTR的著作，Learning to Rank for Information Retrieval 常用的排序学习分为三种类型：PointWise，PairWise和ListWise。也就是训练数据的格式，单文档，双文档，列表文档。1.PointWise 方法学习到全局的相关性，并不对先后...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Ai君臣 学会的就要教给人

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。