1)协作型过滤(见上一篇博客)
2)收集偏好(python中用嵌套的字典表示)
dic = {key:{key :{key{...}}}}
3)寻找相近用户
1.欧几里得距离
物品以及用户对物品的偏好作为x,y,将用户映射到坐标轴上,计算用户之间的距离,距离越短,用户偏好越相似
2.皮尔逊相关度(数据不规范):判断两组数据与某一直线拟合程度的一个度量
3.曼哈顿距离
4.Jaccard距离和Dice系数(两个集合的交集除以并集)
5. 余弦相似度(表示方向上的差异,对距离不敏感)