在推荐系统中它能够基于用户的行为对item进行自动聚类,这些主题/类别可以理解为用户的兴趣。豆瓣书单的例子来说,那么前提是我们要对所有item(图书)进行分类。那如何分呢?假设数据集中有3个user, 4个item, LFM建模的分类数为4
矩阵值Rij表示的是user i 对item j的兴趣度,这正是我们要求的值
矩阵值Pij表示的是user i对class j的兴趣度;
矩阵值Qij表示的是item j在class i中的权重
对于每个user来说,我们把他有过行为的item称为正样本,规定兴趣度RUI=1,
此外我们还需要从item全集中随机抽样,选取与正样本数量相当的样本作为负样本,规定兴趣度为RUI=0。因此,兴趣的取值范围为[0,1]。
采样之后原有的数据集得到扩充,得到一个新的user-item集K={(U,I)},
python源码
https://blog.csdn.net/LieQueov/article/details/79752473