1. 什么是余弦相似度
两条边的夹角,如果夹角越小越相似
2. 计算方法
2.1 二维
a ⋅ b = ∥ a ∥ ∗ ∥ b ∥ ∗ cos θ a \cdot b= \| a \| * \| b \| * \cos\theta a⋅b=∥a∥∗∥b∥∗cosθ
2.2 推广到多维
s i m i l a r i t y = cos θ = A ⋅ B ∥ A ∥ ∥ B ∥ = ∑ i = 1 n A i × B i ∑ i = 1 n ( A i ) 2 × ∑ i = 1 n ( B i ) 2 similarity = \cos\theta = \frac{A \cdot B}{\|A\| \|B\|}=\frac{\sum_{i=1}^nA_i \times B_i}{\sqrt{\sum_{i=1}^n(A_i)^2} \times \sqrt{\sum_{i=1}^n}(B_i)^2} similarity=cosθ=∥A∥∥B∥A⋅B=∑i=1n(Ai)2×∑i=1n(Bi)2∑i=1nAi×Bi
3. 推荐中的余弦相似度
w u v = ∣ N ( u ) ∩ N ( v ) ∣ ∣ N ( u ) ∣ ∣ N ( v ) ∣ w_{uv}=\frac{\vert N(u) \cap N(v)\vert}{\sqrt{\vert N(u)\vert \vert N(v) \vert}} wuv=∣N(u)∣∣N(v)∣∣N(u)∩N(v)∣
变量 | 含义 |
---|---|
u u u | 用户u |
v v v | 用户v |
w u v w_{uv} wuv | uv两个用户的相似度 |
N ( u ) N(u) N(u) | 用户u有过正反馈的物品集合 |
N ( v ) N(v) N(v) | 用户v有过正反馈的物品集合 |
∣ N ( u ) ∣ \vert N(u) \vert ∣N(u)∣ | 集合中元素个数 |
∣ N ( v ) ∣ \vert N(v) \vert ∣N(v)∣ | 集合中元素个数 |
N ( u ) ∩ N ( v ) N(u)\cap N(v) N(u)∩N(v) | 并集 |
∣ N ( u ) ∣ ∣ N ( v ) ∣ \vert N(u) \vert \vert N(v) \vert ∣N(u)∣∣N(v)∣ | 两个集合个数相乘 |