推荐系统中的冷启动和探索利用问题探讨 (下)

最新推荐文章于 2024-07-04 16:42:01 发布

置顶

wh_springer

最新推荐文章于 2024-07-04 16:42:01 发布

阅读量1.4k

点赞数

分类专栏：推荐系统文章标签：推荐系统冷启动和探索利用 LiUCB CLUB

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wh_springer/article/details/77482450

版权

本文探讨了推荐系统中的冷启动和探索利用问题，介绍了基于上下文特征的LinUCB算法，以及用户群聚类的CLUB算法。LinUCB利用线性模型平衡探索与利用，而CLUB算法通过用户群划分实现用户间信息共享，以优化推荐效果。

摘要由CSDN通过智能技术生成

LinUCB算法

回到推荐列表的场景，推荐系统为用户推荐物品。user和item都可以用一系列特征表示。用户特征包括用户的统计历史行为、人口学属性信息；物品特征包括描述信息、类别信息等等。在这种场景下，探索和利用也必须是个体用户级别上实施，因为不同用户看到相同的物品的反馈差异较大。

LinUCB算法是一种基于上下文特征（用户特征、物品特征）的UCB算法，基于特征进行探索和利用。该算法结合上下文特征，选择给用户的推荐物品，同时利用用户反馈及时修正选择策略，以达到最大化收益（提升点击率）的目标。

使用互斥线性模型的LinUCB

LinUCB算法假设推荐item的每次展现收益（是否点击）是和上下文特征成线性关系的，即：

E [r t, a | x t, a] = x T t, a θ * a

$E\left\lbrack r_{t,a}|x_{t,a} \right\rbrack = x_{t,a}^{T}\theta_{a}^{*}$

其中 $x_{t,a}$ 表示用户特征和物品特征的合集， $r_{t,a}$ 表示第t次尝试的收益，a表示item， $\theta_{a}^{*}$ 表示物品a的位置系数向量。可以看出各个item的模型参数是相互独立的（互斥）。

设 $D_{a}$ （d*m）表示为m个训练上下文， $c_{a}$ 表示每个上下文的实际收益，对训练数据 $(D_{a},c_{a})$ 使用岭回归训练出的物品a的参数为：

θ ̂ a = (D T a D a + I d) - 1 * D T a * c a

${\hat{\theta}}_{a} = {(D_{a}^{T}D_{a} + I_{d})}^{- 1}*D_{a}^{T}*c_{a}$

其中 $I_{d}$ 表示d*d的单位矩阵。其中在置信度 $1 - \delta$ 下，模型收益与期望收益满足：

∣ ∣ x T t, a θ ̂ a - E [r t, a | x t, a] ∣

最低0.47元/天解锁文章

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。