本篇建立在电影评分的环境下,对多位成员通过各自电影评分的情况,利用两种相似度测量(欧几里得距离和皮尔逊相关度)查看用户之间的相似度。
Python version3.4
1. 建立影评评分字典
电影种类6种:a,b,c,d,e,f用户7人: Cathy, Sophie, Susie, Antonio,Marco,Jack, Leo
critics={'Cathy':{'a':2.5,'b':3.5,'c':3,'d':3.5,'e':2.5,'f':3},
'Sophie':{'a':3,'b':3.5,'c':1.5,'d':5,'e':1.5,'f':3},
'Susie':{'a':2.5,'b':3,'d':3.5,'f':4},
'Antonio':{b':3.5,'c':3,'d':4,'e':2.5,'f':4.5},
'Marco':{'a':3,'b':4,'c':2,'d':3,'e':2,'f':3},
'Jack':{'a':3,'b':4,'d':5,'e':3.5,'f':3}
'Leo':{'b':4.5,'d':4,'e':1.0}}
先保存该文件为recommendations.py,推荐系统的数据集构造成。
2. 关于欧几里得距离和计算
欧几里得度量定义