Niche Product Retrieval in Top-N Recommendation(2010)

最新推荐文章于 2019-04-13 20:49:00 发布

gingko00

最新推荐文章于 2019-04-13 20:49:00 发布

阅读量411

点赞数

分类专栏：数据挖掘文章标签：利基商品推荐

数据挖掘专栏收录该内容

6 篇文章 0 订阅

订阅专栏

利基产品推荐

摘要：个性化推荐的一大挑战是长尾市场中的目标产品推荐。即推荐目标用户喜欢的，而不是流行产品。针对这一目标，本文提出两种策略，第一种策略是降低商品的流行度，并将其应用到Top-N推荐；第二种策略是基于商品流行度和用户参与度给出先验概率分布，采用统计模型计算用户和商品的相关度。

1、简介

Anderson认为有些商品用传统的销售渠道是无法获得大量销售额的，并认为未来的销售模式是“少即是多”。针对目标用户的长尾产品销售尤其吸引数字产品，因为这类产品的储存成本和运输成本比流行商品少的多。这篇文章关注于提供利基商品和相关商品的产品推荐。本文采用top-N推荐，预测和目标用户可能相关的N件商品，而不是进行评分预测（预测目标用户对商品的打分值）。在top-N推荐中，分类准确率比预测准确性更重要，通常使用准确率和召回率评估系统性能。受Netflix 奖的影响，当前的许多推荐算法主要是预测评分，再进行推荐。我们使用了MovieLens数据集进行了验证，预测评分再进行选择的准确率为0.0125，而KNN算法（top-N推荐）为0.12。本文使用基于项目的KNN算法作为基准模型（简称SR算法）。

2、数据集分析

MovieLens（http://www.movielens.org）数据集共1000000打分数据，6040个用户，3900部电影。

符号含义：m为用户数，n为系统中的商品数，对于每个用户u，Pu表示用户偏好，其计算过程如下：用户u打过分的项目集中的某个项目i，Ui表示给项目i打分的所有用户，Li=|Ui|表示项目i的流行度（给项目i打分的用户数），Pi=Li/m表示相关流行度，pu*是用户u中所有项目Pu的平均流行度，du是用户u打过分的商品数，表示用户的参与度。

pu*和du是负相关的关系，参与度低的用户比参与度高的用户更有可能购买利基商品。

3、评估矩阵

CI（实验评价时进行补充）

4、相关研究

为了满足用户个性化的需求，需要给用户推荐喜欢的非热门商品。提到一篇关于用户多样性推荐的文章。

5、降低流行度

提出降低商品流行度修正商品相关度计算，计算两商品之间的相关度

6、PROBABILISTIC SCORES

算法5降低热门商品出现在推荐列表中的概率，这样做有一个不足，每个用户有自己的商品偏好，可以采用所有用户的平均偏好代替。

动机

SR算法的关键是计算用户和商品之间的关联度，通过统计模型建模，计为PL（S），L表示用户对商品的喜欢行为，针对利基商品的推荐概率pi，只要用户喜欢就进行推荐，而热门商品只有用户极其喜欢才会进行推荐。SR算法结合该策略得到候选集C，从候选集C中得到推荐商品集R

gingko00

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Niche Product Retrieval in Top-N Recommendation(2010)

利基产品推荐摘要：个性化推荐的一大挑战是长尾市场中的目标产品推荐。即推荐目标用户喜欢的，而不是流行产品。针对这一目标，本文提出两种策略，第一种策略是降低商品的流行度，并将其应用到Top-N推荐；第二种策略是基于商品流行度和用户参与度给出先验概率分布，采用统计模型计算用户和商品的相关度。1、简介Anderson认为有些商品用传统的销售渠道是无法获得大量销售额的，并认为未来的销售模式是“少
复制链接

扫一扫