数据间距离及相似度

欧几里得距离(欧氏距离)
d ( x , y ) = [ ∑ i = 1 d ( x i − y i ) 2 ] 1 / 2 d(x, y)=\left[\sum_{i=1}^{d}\left(x_{i}-y_{i}\right)^{2}\right]^{1 / 2} d(x,y)=[i=1d(xiyi)2]1/2也可表示为: d ( x , y ) = ∥ x − y ∥ 2 = ( x − y ) T ( x − y ) d(x, y)=\|x-y\|_{2}=\sqrt{(x-y)^{T}(x-y)} d(x,y)=xy2=(xy)T(xy)
曼哈顿距离(街市距离):
d ( x , y ) = ∑ i = 1 d ∣ x i − y i ∣ d(x, y)=\sum_{i=1}^{d}\left|x_{i}-y_{i}\right| d(x,y)=i=1dxiyi
也可表示为:
d ( x , y ) = ∥ x − y ∥ 2 d(x, y)=\|x-y\|_{2} d(x,y)=xy2

各个方向上距离和。
切比雪夫距离
d ( x , y ) = max ⁡ ( x i − y i ) d(x, y)=\max \left(x_{i}-y_{i}\right) d(x,y)=max(xiyi)
也可表示为:
d ( x , y ) = ∥ x − y ∥ ∝ d(x, y)=\|x-y\|_{\propto} d(x,y)=xy
明可夫斯基距离
dist ⁡ ( X , Y ) = ( ∑ i = 1 n ∣ x i − y i ∣ p ) 1 / p \operatorname{dist}(X, Y)=\left(\sum_{i=1}^{n}\left|x_{i}-y_{i}\right|^{p}\right)^{1 / p} dist(X,Y)=(i=1nxiyip)1/p
余弦相似度:
cos ⁡ ( θ ) = ∑ i = 1 n ( x i × y i ) ∑ i = 1 n ( x i ) 2 × ∑ i = 1 n ( y i ) 2 \cos (\theta)=\frac{\sum_{i=1}^{n}\left(x_{i} \times y_{i}\right)}{\sqrt{\sum_{i=1}^{n}\left(x_{i}\right)^{2}} \times \sqrt{\sum_{i=1}^{n}\left(y_{i}\right)^{2}}} cos(θ)=i=1n(xi)2 ×i=1n(yi)2 i=1n(xi×yi)
c o s ( θ ) cos(\theta) cos(θ)越趋于1,数据越相似。
皮尔森相关系数
r ( X , Y ) = n ∑ x y − ∑ x ∑ y n ∑ x 2 − ( ∑ x ) 2 ⋅ n ∑ y 2 − ( ∑ y ) 2 r(X, Y)=\frac{n \sum x y-\sum x \sum y}{\sqrt{n \sum x^{2}-\left(\sum x\right)^{2}} \cdot \sqrt{n \sum y^{2}-\left(\sum y\right)^{2}}} r(X,Y)=nx2(x)2 ny2(y)2 nxyxy

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值