立即学习:https://edu.csdn.net/course/play/10085/215017?utm_source=blogtoedu
1、协同过滤(基于用户/基于商品)缺点就是得到的矩阵稀疏;另外计算相似性时,要逐个去比对,计算量太大。但是基于商品的相对计算量小点。
、基于矩阵分解的好处:原始数据太庞大,用类似矩阵分解的方式进行降维——计算起来就方便了
3、我们这里实践采用的是:基于商品的协同过滤 +基于SVD矩阵分解做推荐(高效)
4、代码:统计每个用户的播放总量:
4.1、play_count当前播放次数,output_dict[user]这个用户以前的播放次数,两个数值加和
4.2、DataFrame:
https://www.jianshu.com/p/8024ceef4fe2