机器学习排序算法：RankNet to LambdaRank to LambdaMART

最新推荐文章于 2024-05-20 16:00:40 发布

weixin_30498921

最新推荐文章于 2024-05-20 16:00:40 发布

阅读量261

收藏

点赞数

文章标签：人工智能

原文链接：http://www.cnblogs.com/mfryf/p/11432976.html

版权

使用机器学习排序算法LambdaMART有一段时间了，但一直没有真正弄清楚算法中的所有细节。

学习过程中细读了两篇不错的博文，推荐给大家：

梯度提升树(GBDT)原理小结

徐博From RankNet to LambdaRank to LambdaMART: An Overview

但经过一番搜寻之后发现，目前网上并没有一篇透彻讲解该算法的文章，所以希望这篇文章能够达到此目的。

本文主要参考微软研究院2010年发表的文章From RankNet to LambdaRank to LambdaMART: An Overview

1. 概述

RankNet、LambdaRank和LambdaMART是三个关系非常紧密的机器学习排序算法。简而言之，RankNet是最基础，基于神经网络的排序算法；而LambdaRank在RankNet的基础上修改了梯度的计算方式，也即加入了lambda梯度；LambdaMART结合了lambda梯度和MART（另称为GBDT，梯度提升树）。这三种算法在工业界中应用广泛，在BAT等国内大厂和微软谷歌等世界互联网巨头内部都有大量应用，还曾经赢得“Yahoo！Learning To Rank Challenge(Track 1)"的冠军。本人认为如果评选当今工业界中三种最重要的机器学习算法，以LambdaMART为代表的集成学习算法肯定占有一席之地，另外两个分别是支持向量机和深度学习。

2. RankNet

2.1 算法基础定义

RankNet解决如下搜索排序问题：给定query集合，每个query都对应着一个文档集合，如何对每个query返回排序后的文档集合。可以想象这样的场景：某位高考生在得知自己的成绩后，准备报考志愿。听说最近西湖大学办得不错，所以就想到网上搜搜关于西湖大学的资料。他打开一个搜索引擎，输入“西湖大学”四个字，然后点击“搜索”，页面从上到下显示了10条搜索结果，他认为排在上面的肯定比下面的相关，所以就开始从上往下一个个地浏览。所以RankNet的目标就是对所有query，都能将其返回的文档按照相关性进行排序。

RankNet网络将输入query的特征向量

P i j \equiv P (U i ⊳ U j) \equiv 1 1 + e - σ ( s i - s j )

这个概率实际上就是深度学习中经常使用的sigmoid函数，参数

S i j = ⎧⎩⎨ 1 0 - 1 文 档 i 比 文 档 j

定义

C = - P ¯¯¯¯ i j l o g P i j - (1 - P ¯¯¯¯ i j) l o g (1 - P i j

如果不太熟悉什么是交叉熵，可以参考宗成庆老师的《统计自然语言处理》2.2节“信息论基本概念”，里面将熵、联合熵、互信息、相对熵、交叉熵和困惑度等概念都讲得相当清楚。

结合以上多个公式，可以改写损失函数

C = 1 2 ( 1 - S i j ) σ ( s i - s j ) + l o g ( 1 + e - σ ( s i - s j

对于

C = l o g (1 + e - σ (s i - s j))

然而对于

C = l o g (1 + e - σ (s j - s i))

可以看出损失函数

分析损失函数

lim s i - s j \to \infty C = lim s i - s j \to \infty l o g (1 + e - σ (s i -

如果

lim s i - s j \to \infty C = lim s i - s j \to \infty l o g (1 + e - σ (s i -

利用神经网络对模型进行训练，目前最有效的方法就是反向传播算法。反向传播算法中最核心部分就是损失函数对模型参数的求导，然后可以使用下面的公式对模型参数进行迭代更新：

w k \leftarrow w k - η \partial C \partial w k = w k - η ( \partial C \partial

损失函数

\partial C \partial s i = σ ( 1 2 ( 1 - S i j ) - 1 1 + e σ ( s

δ C = \sum k \partial C \partial w k δ w k = \sum k \partial C \partial w k

2.2 RankNet分解形式：加速RankNet训练过程

2.1节中定义的RankNet，对于每一个文档对

对于给定的文档对

\partial C \partial w k = \partial C \partial s i \partial s i \partial w k +

其中：

λ i j = \partial C ( s i - s j ) \partial s i = σ ( 1 2 ( 1 - S i j

定义

δ w k = - η \sum (i, j) \in I (λ i j \partial s i \partial w k - λ

其中：

λ i = \sum j : {i, j} \in I λ i j - \sum j : {j, i} \in I λ i j

通俗地说，

δ w k = - η \sum {i, j} \in I (λ i j \partial s i \partial w k - λ

转载于:https://www.cnblogs.com/mfryf/p/11432976.html

weixin_30498921

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

余额充值