这几天学习计算相似性的算法以及基于相似性做推荐的算法。
逼格高点的名字叫做基于协同过滤算法的推荐系统 Collaborative Filtering Recommendation。
简单的说,系统的任务是寻找和你兴趣相近的一组人,然后根据这组人喜欢什么来给你推荐什么。
首先,需要计算每个人和你的兴趣的相似程度。
要计算相似程度的前提是要有数据,每个人对事物的喜爱程度。
有数据后就能计算任意两个人之间的相似性,
有两种简单的算法,欧几里得距离分值法 Euclidean Distance Score和皮尔逊相关分值法 Pearson Correlation Score
-------------------------------------------------
欧几里得距离
判断两个人的相似程度,就是计算两人的空间距离。距离越近越相似,距离越远越不相近。
先找出两个人共同评价过的事物的集合,人1和人2对物1的评价值之差就是两人在一维空间的距离,人1和人2对物1的评价值之差的平方与两人对物2的评价值之差的平方之和的平方根就是两人在二维空间的距离(两点距离等于x值