我们在使用各类型的软件的时候,总是能在各大app中获取到推荐信息的数据,而且会发现推荐的信息数据还比较适合个人的口味,例如说某些共同兴趣爱好的好友推荐,某些好听的音乐推荐等等。
在进行推荐系统的核心算法介绍之前,我们需要先来回顾一下以前所学过的数学知识内容。
欧几里得距离
二维的欧几里得距离:
例如下图所示,在这样的一个简单的二维空间图里面,根据对于a点的坐标和b点的坐标进行二维空间距离的计算,假设p为点a到点b的欧式距离,那么可以根据勾股定理来计算出两点之间的向量距离为:
三维空间的欧几里得距离:
除了常见的二维空间之外,常用于的计算场景还有可能是基于三维空间运算的。
在这种场景下,假设计算A点和B点之间的距离为p,那么计算可以得出p的值为:
在了解了这些基本的知识点之后,我们再结合实际的应用场景来展开应用。
例如说一个电影影评网站,需要加入一个推荐喜欢观看同类电影的好友功能。
首先模拟出一个具体的数据场景:
1对该电影进行过评价,0没有对该电影进行过评价
有了这样的一个数据统计场景之后,我们可以根据对电影是否有共同评价进行共同兴趣爱好的匹配推荐。但是这种场景下也有一定的缺陷,那就是对于电影的评价有好有坏,需要将共同喜爱同一类电影的用户进行匹配推荐,将不喜欢同一类电影的用户进行匹配推荐就属于推荐失误的场景了。
改进点
在用户评论里面加入对于电影的打分功能,我们将打分等级也进行一个分类
那么我们将这里的打分等级和上述的电影评价相互结合之后便可得出下表:
根据上述的这张表,我们再回顾到本文开始时候所说的二维和三维空间里面的欧几里得距离计算。
假设A点的坐标为A(a1,a2…),B点坐标为B(b1,b2…)
二维空间距离计算:
三维空间距离计算:
类比一维、二维、三维的表示方法,n 维空间中的某个位置,我们可以写作(X1X1,X2X2,X3X3,…,XKXK)。这种表示方法我们称之为向量。
n维空间的距离计算: