1. Item-cf实现的基本原理
下面以一个实例来展示使用perason相似度计算的item-cf算法
1.1:计算物品相似度(以《寻龙诀》和《小门神》两部电影为例)
Index栏的A,B,C,D,E,F,G为用户,column栏为电影的评分。
距离:A/老炮儿 栏 评分为3.5,即代表A用户对老炮评分为3.5分。
1.2计算Pearson相似度
计算公式:
我们选《寻龙诀》(X)和《小门神》(Y)作为例子,来算一下相似度,则
X=(3.5,5.0,3.0)
Y=(3.0,3.5,2.0)
数字就是评分,因为只有三个人同时看了这两个电影,所以X,Y两个向量都只有三个元素。
求相关系数,这个可以直接通过numpy提供的corrcoef方法计算。