推荐算法之Topic Model，Latent Factorization Model(LFM)的联系以及Tensor Factorization(TF)

最新推荐文章于 2024-04-24 15:30:16 发布

徐不依

最新推荐文章于 2024-04-24 15:30:16 发布

阅读量3.3k

点赞数 5

分类专栏：推荐算法文章标签： Topic Model LFM

本文链接：https://blog.csdn.net/shulixu/article/details/60576359

版权

本文探讨了Topic Model（如LFM）和张量分解（TF）在推荐系统中的应用。这两种方法通过分解用户*item矩阵或张量，揭示隐藏的主题和用户兴趣。LFM提供了一种无需预先确定主题或分类的方式，通过调整分类数控制粒度，实现自动聚类。文章还介绍了LFM的损失函数和优化过程，以及在数据集平衡和参数选择上的注意事项。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Topic Model，Latent Factorization Model(LFM)都是把用户*item矩阵进行分解，中间产生的就是隐变量（在主题模型中被称为隐含主题）。TF就是更高维度的张量（比如加入环境变量或者上下文信息）用不同的分解方法（Tucker,CP）进行张量分解。

以下来自http://blog.csdn.net/pipisorry/article/details/45665779

隐语义模型LFM和LSI，LDA，Topic Model其实都属于隐含语义分析技术，是一类概念，他们在本质上是相通的，都是找出潜在的主题或分类。这些技术一开始都是在文本挖掘领域中提出来的，近些年它们也被不断应用到其他领域中，并得到了不错的应用效果。比如，在推荐系统中它能够基于用户的行为对item进行自动聚类，也就是把item划分到不同类别/主题，这些主题/类别可以理解为用户的兴趣。

问题：

对于一个用户来说，他们可能有不同的兴趣。就以作者举的豆瓣书单的例子来说，用户A会关注数学，历史，计算机方面的书，用户B喜欢机器学习，编程语言，离散数学方面的书，用户C喜欢大师Knuth, Jiawei Han等人的著作。那我们在推荐的时候，肯定是向用户推荐他感兴趣的类别下的图书。那么前提是我们要对所有item（图书）进行分类。那如何分呢？大家注意到没有，分类标准这个东西是因人而异的，每个用户的想法都不一样。拿B用户来说，他喜欢的三个类别其实都可以算作是计算机方面的书籍，也就是说B的分类粒度要比A小；拿离散数学来讲，他既可以算作数学，也可当做计算机方面的类别，也就是说有些item不能简单的将其划归到确定的单一类别；拿C用户来说，他倾向的是书的作者，只看某几个特定作者的书，那么跟A，B相比它的分类角度就完全不同了。

显然我们不能靠由单个人（编辑）或team的主观想法建立起来的分类标准对整个平台用户喜好进行标准化。

此外我们还需要注意的两个问题：