余弦相似度
定义
为了确定两个向量的相似度,我们用余弦相似度来进行衡量:
- 当两个向量很相似的时候,夹角比较小,余弦相似度的值接近1
- 当两个向量不相似的时候,夹角接近90度(正交),余弦相似度的值接近0
- 当两个向量相反的时候,夹角比较小,余弦相似度的值接近-1
图像理解如下:
关键代码如下:
def cosSim(u,v):
dot = np.dot(u,v)
u_norm = np.linalg.norm(u)
v_norm = np.linalg.norm(v)
return dot/(u_norm*v_norm)