长尾推荐算法论文阅读笔记合集（papers / literatures for long tail recommendation）

最新推荐文章于 2024-03-12 16:55:49 发布

不叫terence叫啥

最新推荐文章于 2024-03-12 16:55:49 发布

阅读量3.2k

点赞数 10

文章标签：推荐系统机器学习数据挖掘

本文链接：https://blog.csdn.net/qq_41536315/article/details/104527428

版权

写在前面：

（1）我将长尾推荐系统相关论文做了一个整理，主要包括：论文题目、发表的会议/期刊（出处）、发表时间、被引量（主要是google scholar），有的论文将对其内容进行简单介绍。最后提供这些论文pdf网盘，其中有些论文官网下载要钱的。需要自取！望大家点赞！！
网盘链接：https://pan.baidu.com/s/1hYjXL1o3Hi7wgrVOh8m9Ig
提取码：kjg3

（2）论文质量有点参差不齐，带*的是比较好（高被引）且我认为比较有意义的几篇论文。

（3）若有不足之处，多多指教多多包涵！

可能会不定期更新。。。

1. * Challenging the Long Tail Recommendation

出处：Proceedings of the VLDB Endowment（数据挖掘三大顶会之一）

时间：2012

google scholar 被引量：160

此篇论文笔记见：点击这里跳转

（注：下面也将按照出处、时间、被引量的顺序进行）

2. Enhancing Long Tail Item Recommendations Using Tripartite Graphs and Markov Process

Proceedings of the International Conference on Web Intelligence——2017——5
文章贡献：

（1）主要是对Challenging the Long Tail Recommendation**（Yin,…)和Collaborative Filtering with Diffusion-based Similarity on Tripartite Graphs（Shang）**中的工作做了拓展。本文结合了Yin使用的算法，适应了Shang提出的三重图。将Yin方法与Shang的研究相结合，通过协同过滤产生推荐。

（2）本文讨论了Yin等人提出的算法和Shang等人提出的一组相似算法，它们通过随机游走器遍历二部图，以识别相似的用户和产品。本文建立在每个工作的元素以及Markov过程的元素之上，以便于随机walker遍历三部图到长尾区域。这种方法特别地将路径构造成对用户有利的长尾区域。

3. * Collaborative Filtering with Diffusion-based Similarity on Tripartite Graphs

Physica A: Statistical Mechanics and its Applications——2010——99
文章贡献：

（1）Collaborative tags在信息系统的组织中起着越来越重要的作用。本文研究了利用用户，对象和标签之间的三元关系的个性化推荐模型。作者基于用户的偏好和标签信息提出了一种衡量用户相似性的方法。通过使用基于扩散的过程来计算用户之间的两种相似性，然后将其整合以进行推荐。

（2）结论：在具有三个指标的标准协作过滤框架中测试了该方法的排名得分，查全率和查准率，并证明其性能优于常用的余弦相似度。

4. Recommendation networks and the long tail of electronic commerce

MIS Quarterly——2012——262
文章贡献：

（1）使用Google的PageRank中心性度量的变体来衡量一个产品在这个由推荐组成的超链接网络中的位置对它的影响程度。

（2）将网络对每个类别的平均影响与其需求和收入分布的不平等联系起来，使用从类别的Lorenz曲线导出的基尼系数量化该不平等。

（3）最后就是一些经济学上的意义，不做说明。

5. * Multi-objective optimization for long tail recommendation

KBS——2016——38
文章贡献：

本文主要聚焦推荐系统推荐结果的【准确性】【推荐长尾项目的能力】，设计了一种Multi-objective optimization framework（多目标优化框架）。即主要通过优化的思想通过权衡同时提升推荐结果的【准确性】以及【推荐长尾项目的能力】。

6. Improving recommendation for long-tail queries via templates

WWW——2011——103
本来是搜索算法领域的，但我觉得对推荐算法很有启发意义。
文章贡献：

（1）针对搜索结果很少触发长尾查询的问题，本文提出了一种方法，通过在查询模板之间推理规则（即templates），而不是像目前在查询流程图模型中那样，将查询辅助技术（特别是查询推荐）的范围扩展到长尾查询。例子如下：如果我们认识到“Montezuma”是一个罕见的“Montezuma surf”查询中的城市，并且如果观察到规则“surf”—beach”，我们就可以提供“Montezuma beach”作为推荐。

（2）结果：在不影响查询质量的情况下，覆盖率可以提高24%。

www 好吧，仔细读了一下论文才发现没什么 luan 用。

7. * The Long Tail of Recommender Systems and How to Leverage It

RecSys 2008——307
文章贡献：

提出通过聚类解决长尾商品和头部商品不平衡的问题。具体是：

（1）将整个项目集分解为头部和尾部，只对尾部项目进行聚类。

（2）然后，对尾部项目的建议是基于这些集群中的评级，对头部项目的建议是基于单个项目的评级。

文章表明，如果**【划分】和【聚类】**做得好，就能在保持合理计算性能的同时，降低尾部项的推荐错误率。

8. ** Solving the apparent diversity-accuracy dilemma of recommender systems

PNAS——2010——807
文章贡献：

提出了一种混合算法**“heat-spreading”**，该算法通过使用加权线性聚合将注重精度和新颖性的算法相结合。在该混合算法中，使用参数来找到这两个目标之间的平衡，并且针对一元数据提出了该算法。

9. * Novelty and Diversity in Top-N Recommendation – Analysis and Evaluation

ACM Transactions on Internet Technology (TOIT), 2011
233
文章贡献：

（1）多样性问题定义：对其进行了详细的分析和实现。首先要考虑控制参数的重要性，它决定了在推荐中Diversity的重要性。此外，该公式允许开发新的解决策略来解决由此产生的优化问题。

（2）New Evaluation Methodology：提出的评价方法学既考虑到新颖性又考虑到相关性，通过对相关建议的新颖性进行精确性和召回性评价。

（3）新颖项目推荐方法的实证分析：本文演示了如何将多样性增强策略与任何CF或基于案例的推荐引擎相结合，并详细讨论了如何在基于项目的SUGGEST CF算法，和使用标准查询案例相似度函数的基于案例的检索框架中实现这种结合。最后本文充分比较不同的目标函数和优化策略，并将它们应用于三个不同的数据集。

10. * Trading-offamong accuracy, similarity, diversity, and long-tail: a graph-based recommendation approach，，，

ACM RecSys '2013
43
文章贡献：

（1）本文提出了一种基于图的推荐方法以在准确性、相似性、多样性以及长尾特性之间进行有效和灵活的权衡。

（2）本文的方法是基于一阶马尔可夫图的，该图具有用户-项目对之间的转移概率信息。在该图上提出了**“cost flow”**（成本流）的概念，以便向用户推荐成本较低的商品。成本流以递归动态形式表示，其稳定性可以通过适当降低过渡成本来保证。此外，通过组合与长尾，聚焦度和相似性有关的三种要素来设计过渡成本的混合。

（3）为了评估结果，本文提出了一个正交-稀疏-正交的非负矩阵三因子分解模型和一个有效的乘法算法。最后对现实世界数据进行的经验实验表明，证明本文的方法很有效。
PS：附上原文链接

11. * Pareto-efficient hybridization for multi-objective recommender systems，，，

ACM RecSys’ 2012
87
文章贡献：

（1）提出了一种混合推荐算法，该算法结合了一些现有的算法，其中多目标进化算法被用来找到不同算法的几个混合参数。

12. Combining usage and content in an online recommendation system for music in the Long Tail

International Journal of Multimedia Information Retrieval——2013——43
文章贡献：

（1）本文提出了一个结合【用户使用情况】和【内容数据】的混合式线上音乐推荐系统，并将其与单独的【基于用户使用情况推荐系统】和【基于内容数据推荐系统】进行比较，证明**【混合式】**推荐系统效果比【单独的】具有更高的用户绝对访问率、更高的用户活动率和更高的用户忠诚度。

（2）推荐衡量标准：
- accuracy准确率
- coverage覆盖率
- shortcut gain：衡量推荐系统给用户节省的点击次数。
另外可参考【这篇博客】

13. WEB VIDEO RECOMMENDATION AND LONG TAIL DISCOVERING

2008 IEEE International Conference on Multimedia and Expo——22
文章贡献：

本文提出了利用多模态相似度和上下文网络来组织不同主题的web视频的相关探索性推荐算法。对比实验表明，该方法能产生更准确的视频关联度。并且我们的方法在发现用户在长尾视频中的潜在兴趣方面更加灵活。
PS：主要是视频推荐

14. * The Adaptive Clustering Method for the Long Tail problem of Recommender Systems

IEEE Transactions on Knowledge and Data Engineering——2013——42
文章内容：

（1）本文提出了一种基于流行度的【自适应聚类推荐方法】。本文提出的方法是根据项目的流行程度对其进行聚类的，因此，针对尾部项目的建议基于更密集分组的组中的评分，而针对头项的建议则基于单个项目或组的评分，而将其分组到较小的类别程度。

（2）结论：本文将此方法应用于两个实际数据集，并在推荐准确性和可扩展性方面将结果与非分组和完全分组的方法进行比较。结果表明，如果适当地进行了这种自适应聚类，则该方法可以降低尾项的推荐错误率，同时保持合理的计算性能。
文章链接：点击这里

15. Niche Product Retrieval in Top-N Recommendation

Published in: 2010 IEEE/WIC/ACM International Conference on Web Intelligence and Intelligent Agent Technology
被引量：11
文章贡献：

本文提出了两种识别相关的但是属于长尾产品的策略。第一种策略计算逆向项目受欢迎度，并在top-N推荐步骤中应用。给定基于项目流行度的相关性先验概率分布和用户特定的相关性概率，另一个策略使用基于这两个分布之间距离度量的分数。

16. A trust-aware recommendation method based on Pareto dominance and confidence concepts

KBS, 2017, 48
文章贡献：

（1）协同过滤算法中的用户-评分矩阵通常都是很稀疏的，这会导致不可靠的推荐结果；

（2）用户之间的信任申明信息可以提高推荐效果，但是大多数数据中是没有这类信息的；

（3）本文提出了一种通过应用特定的可靠性度量来识别隐式信任声明的方法。最后在准确率和覆盖率都比协调过滤算法有所提升。

17. A framework for diversifying recommendation lists by user interest expansion

KBS, 2016, 15
文章内容和贡献：

推荐系统已被广泛用于发现用户的喜好，并在此信息负载时代向用户推荐有趣的项目。推荐系统领域的研究人员已经意识到，排名靠前的推荐列表的质量不仅涉及相关性，而且还涉及多样性。大多数传统推荐算法很难生成能够涵盖每个用户大部分兴趣的多样化项目列表，因为它们主要集中在预测与用户的主要兴趣相似的准确项目上。此外，他们很少利用语义信息（例如项目标签和用户兴趣标签）来提高推荐的多样性。

本文提出了一种新颖的推荐框架，该框架主要采用基于【社会标签信息】的用户兴趣扩展策略。该框架通过扩展原始用户项目交互记录的大小和类别来增强用户偏好的多样性，然后采用传统的推荐模型来生成推荐列表。

（1）这项研究的第一个创新是提出的推荐多元化框架，该框架主要利用基于社会标签信息的用户兴趣扩展。据我们所知，很少有研究考虑通过探索有关RS和STS的文献中的社会标签信息来增强推荐多样性。扩大用户兴趣以改善推荐多样性的想法也是创新的。这一创新框架的优势在于，它可以在我们的框架内利用各种先进的传统RS，以确保较高的推荐准确性。另一个优点是采用社交标签信息来扩展用户兴趣可以促进推荐准确性和多样性的共同提高。

（2）第二项创新是，我们在实验评估中开发了一种新颖的多样性指标，即**【标签覆盖率】**（即文中的TagCov）。该度量可以有效地评估用户兴趣的多样性，从而丰富了有关RS评估的多样性度量指标。

（3）在三个实际数据集上的实验结果表明，我们的方法可以胜过现有数据集。特别是，我们的方法可以比现有建议更有效地提高建议的多样性和准确性。

18. A Generic Top-N Recommendation Framework For Trading-off Accuracy, Novelty, and Coverage

ICDE, 2018, 5
文章贡献：

（1）本文研究了估计用户长尾新奇偏好的各种方法，并提出了一个优化问题，以直接从第二节的交互数据中学习用户对长尾项目的偏好；

（2）本文将用户偏好估计整合到GANC（第三节）中，并引入了基于有序抽样的Lo-caly贪心（OSLG）算法，该算法依赖于用户的长尾偏好来纠正流行度偏差（第三-C节）；

（3）本文进行了广泛的实证研究，并从准确性、新颖性和每次检查的覆盖率等方面对绩效进行了评估（第四节）。

19. A Hybrid Approach to Recommend Long Tail Items

Workshop de Teses de Dissertações（WTD），2018
被引量为0
文章贡献：

（1）本研究以混合方式应用文献中的两种技术。第一种技术是通过马尔可夫链计算用户项图的节点相似度。第二种技术应用了聚类，其中项目被分成不同的聚类：流行项目（短尾）和非流行项目（长尾）。

（2）结论：与基于马尔可夫链（markov-chain）的算法相比，利用混合算法，能够将召回率提高27.97%，这表明更倾向于长尾产品。同时，建议的项目更加多样化和不受欢迎，这表明更多的目标是长尾产品。
PS: 本文方法主要是Challenging the Long Tail Recommendation（hitting time）和The Long Tail of Recommender Systems and How to Leverage It（聚类方法）的结合。

20. Balancing accuracy and diversity in recommendations using matrix completion framework

KBS, 2017, 10
文章贡献：

（1）为了避免单调和改善客户体验，有必要提出具有可接受准确度的多样化建议。然而，随着**【多样性】的增加，推荐【准确率】**也随之降低，因此需要在两者之间进行最佳权衡。

（2）本文通过在矩阵完成框架上建立的单个（联合）优化模型，通过利用可用的评级和项目元数据来实现【准确性-多样性平衡】。在现有的协同过滤技术的基础上，大多数现有的工作提出了一个两阶段的模型、一个启发式的项目排序方案。

（3）结论：与现有技术相比，本文模型在给定精度下降的情况下获得了更高的多样性。

21. Improve the “Long Tail" Recommendation through Popularity-Sensitive Clustering

期刊信息查不到
2015，被引量2
文章内容：

（1）摘要：协同过滤（CF）是构建推荐系统最成功的方法之一。在推荐系统中，“长尾”项目被认为是特别有价值的。许多基于CF的聚类算法只设计用于处理“长尾”项，而其他算法则会影响总体推荐精度和“长尾”性能。我们的方法是基于项目流行度信息的利用。我们证明了“长尾”推荐可以通过每个聚类的均衡项目流行度来精确推断。提出了一种新的人气敏感聚类方法。通过在MovieLens、citeUlike和MobileApp上的实验，我们的方法在“长尾”和总体精度上都优于以前的方法。

（2）提出了一个聚类目标函数，该函数直接对每个聚类中的项目流行度进行建模。

（3）提出一个增量式优化演算法来优化所提出的目标函数。

（4）实验结果表明，本文提出的人气敏感聚类方法确实产生了更均匀分布的项目人气聚类，不仅提高了“长尾”推荐的准确率，而且提高了多种推荐方法的总体推荐准确率。

22. 一种由长尾分布约束的推荐方法

计算机研究与发展Journal of Computer Research and Development——2013年09期——被引量个位数
由于是中文论文，直接附上知网链接点击
文章内容：

提出一种由长尾分布约束的推荐方法(long tail distribution constrained recommendation method,LTDCR),由用户行为的相似度确定用户间相似关系,并应用不信任关系约束用户相似关系的传播,通过长尾分布约束由用户间相似关系计算的推荐权重,并给出一种精确描述长尾分布的方法.在包含大量冷门商品的数据集的实验结果表明,LTDCR在训练集较小的情况下,有效地提高了对冷门商品的推荐效果.

23. 推荐系统研究进展

计算机科学与探索, 2015——20
参考意义不大，大家可以忽略，对我来说可以参考其中的推荐结果评估部分
由于是中文论文，直接附上知网链接推荐系统研究进展

24. *电子商务中长尾物品推荐方法

《计算机应用》，2015
中国知网被引量：13
附上知网链接：点击这里
文章内容：

（1）提出了这样一种方法,将整个物品构成的集合分为头部和尾部两个部分(其中头部是由评分数目多的物品构成的集合,尾部是由评分数目少的物品构成的集合),并只对尾部物品进行【聚类】。

（2）这样,位于头部的物品依赖于自身的评分进行推荐,而尾部的物品则依赖于它所在的聚类中所有评分进行推荐。

（3）最终实验结果表明,采用该方法的实验中有86.15%预测的准确率都得到了提升,平均性能提升了10%,因此如果能够选取一个恰当的头部和尾部的切割点,就可以在保持合理的计算性能的情况下,提高推荐的准确性。

25. 多主题受限玻尔兹曼机的长尾分布推荐研究

小型微型计算机系统，2018
中国知网被引量3
附上知网链接，点击这里
文章贡献：

通过提取用户偏好及商品的主题，结合改进受限玻尔兹曼机对商品未知主题权重的预测，以解决对长尾商品的推荐问题．试验结果表明了本文推荐算法的有效性和可行性。
PS: （主要是为了提一下下面这篇神论文）受限玻尔兹曼机相关知识参考神一般的论文：Restricted Boltzmann Machines for Collaborative Filtering

26. Mitigating long tail effect in recommendations using few shot learning technique

2020
文章贡献：

（1）提出了一种新颖的框架来减轻长尾效应并克服了有限的评分问题。

（2）Siamese network最近在许多实例数量有限的领域中表现良好。在提出的框架中，计算每个用户的生命统计，并将此信息提供给深度Siamese network，用训练好的Siamese network用于识别与每个用户喜欢的物品相似的长尾物品。最后，将识别出的长尾物品推荐给适当的用户。

（3）我们引入了三种新颖的绩效指标来评估长尾项目的建议。

27. 个性化推荐系统的多样性研究进展

图书情报工作——2013——17（中国知网中被引量81）
文章贡献：

分析多样性类型的基础上，重点对信息物理、二次优化、社会化网络和时间感知４种提高个性化推荐多样性的方法进行概括、比较和分析，接着总结推荐系统多样性的主要度量指标。最后，对未来有等深入研究的问题进行展望。研究指出：移动推荐系统的多样性和新颖性研究，信息物理方法应用于推荐系统领域的机理分析，推荐系统的时序多样性和计算量问题以及各种推荐算法的有效组合研究是未来需重点突破的方向。
由于是中文论文，直接附上知网链接点击
PS: 加上这篇论文主要是推荐结果多样性和推荐长尾项目息息相关，也是为了参考**【推荐系统多样性的主要度量指标】**。