1、什么是协同过滤
顾名思义,协同过滤包括协同和过滤两个操作。所谓协同就是协同大家的反馈、评价和意见行来进行决策(推荐),生物上有协同进化的说法,通过协同的作用,让群体逐步进化到更佳的状态。对于推荐系统来说,通过用户的持续协同作用,最终给用户的推荐会越来越准。而过滤,就是通过协同将海量的信息进行过滤,从中筛选出目标用户可能感兴趣的推荐过程。
如上图中所示协同过滤推荐过程按照图(a)~(f)分成了六步。在这些步骤中,分别根据不同用户对不同商品的评价,就建立起一个矩阵,叫做共现矩阵。需要进行推荐的就是不同用户未进行体验打分的商品。通过共现矩阵将用户评分信息或者商品被评分信息进行one-hot编码(详解见:https://blog.csdn.net/qq_38375203/article/details/124519359?spm=1001.2014.3001.5502),所谓“协同”就是找出和自己兴趣相似的top k用户,然后综合这些用户对商品的评价,进而过滤预测出自己感兴趣的商品。
2、用户相似度计算
协同过滤的核心是怎么计算用户之间的相似度或者商品之间的相似度。我们可以采用非常朴素的思想来计