Niche Product Retrieval in Top-N Recommendation(2010)

利基产品推荐

摘要:个性化推荐的一大挑战是长尾市场中的目标产品推荐。即推荐目标用户喜欢的,而不是流行产品。针对这一目标,本文提出两种策略,第一种策略是降低商品的流行度,并将其应用到Top-N推荐;第二种策略是基于商品流行度和用户参与度给出先验概率分布,采用统计模型计算用户和商品的相关度。

1、简介

Anderson认为有些商品用传统的销售渠道是无法获得大量销售额的,并认为未来的销售模式是“少即是多”。针对目标用户的长尾产品销售尤其吸引数字产品,因为这类产品的储存成本和运输成本比流行商品少的多。这篇文章关注于提供利基商品和相关商品的产品推荐。本文采用top-N推荐,预测和目标用户可能相关的N件商品,而不是进行评分预测(预测目标用户对商品的打分值)。在top-N推荐中,分类准确率比预测准确性更重要,通常使用准确率和召回率评估系统性能。受Netflix 奖的影响,当前的许多推荐算法主要是预测评分,再进行推荐。我们使用了MovieLens数据集进行了验证,预测评分再进行选择的准确率为0.0125,而KNN算法(top-N推荐)为0.12。本文使用基于项目的KNN算法作为基准模型(简称SR算法)。

2、数据集分析

MovieLens(http://www.movielens.org)数据集共1000000打分数据,6040个用户,3900部电影。

符号含义:m为用户数,n为系统中的商品数,对于每个用户u,Pu表示用户偏好,其计算过程如下:用户u打过分的项目集中的某个项目i,Ui表示给项目i打分的所有用户,Li=|Ui|表示项目i的流行度(给项目i打分的用户数),Pi=Li/m表示相关流行度,pu*是用户u中所有项目Pu的平均流行度,du是用户u打过分的商品数,表示用户的参与度。

pu*和du是负相关的关系,参与度低的用户比参与度高的用户更有可能购买利基商品。

3、评估矩阵

CI(实验评价时进行补充)

4、相关研究

为了满足用户个性化的需求,需要给用户推荐喜欢的非热门商品。提到一篇关于用户多样性推荐的文章。

5、降低流行度

提出降低商品流行度修正商品相关度计算,计算两商品之间的相关度

6、PROBABILISTIC SCORES

算法5降低热门商品出现在推荐列表中的概率,这样做有一个不足,每个用户有自己的商品偏好,可以采用所有用户的平均偏好代替。

动机

SR算法的关键是计算用户和商品之间的关联度,通过统计模型建模,计为PL(S),L表示用户对商品的喜欢行为,针对利基商品的推荐概率pi,只要用户喜欢就进行推荐,而热门商品只有用户极其喜欢才会进行推荐。SR算法结合该策略得到候选集C,从候选集C中得到推荐商品集R








  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值