数值型数据距离

闵可夫斯基距离

d ( i , j ) = ∣ x i 1 − x j 1 ∣ h + ∣ x i 2 − x j 2 ∣ h + . . . + ∣ x i d − x j d ∣ h h d(i,j)=\sqrt[h]{\left | x_{i1}-x_{j1}\right | ^h+\left | x_{i2}-x_{j2}\right | ^h+...+\left | x_{id}-x_{jd}\right | ^h } d(i,j)=hxi1xj1h+xi2xj2h+...+xidxjdh
i=(xi1,xi2…xid),i=(xj1,xj2…xjd)分别代表两个d维数据对象,h为序,上述距离也被称为Lh范式

曼哈顿距离

h=1,L1范式
d ( i , j ) = ∣ x i 1 − x j 1 ∣ + ∣ x i 2 − x j 2 ∣ + . . . + ∣ x i d − x j d ∣ d(i,j)=\left | x_{i1}-x_{j1}\right | +\left | x_{i2}-x_{j2}\right | +...+\left | x_{id}-x_{jd}\right | d(i,j)=xi1xj1+xi2xj2+...+xidxjd

欧氏距离

h=2,L2范式
d ( i , j ) = ∣ x i 1 − x j 1 ∣ 2 + ∣ x i 2 − x j 2 ∣ 2 + . . . + ∣ x i d − x j d ∣ 2 2 d(i,j)=\sqrt[2]{\left | x_{i1}-x_{j1}\right | ^2+\left | x_{i2}-x_{j2}\right | ^2+...+\left | x_{id}-x_{jd}\right | ^2} d(i,j)=2xi1xj12+xi2xj22+...+xidxjd2

极大距离

h=∞,L范式, d ( i , j ) = m a x ∣ x i f − x j f ∣ d(i,j)=max\left | x_{i}f-x_{j}f\right | d(i,j)=maxxifxjf

示例

点集特征1特征2
x112
x235
x320
x445

曼哈顿距离

L1x1x2x3x4
x10
x250
x3360
x46170

欧氏距离

L2x1x2x3x4
x10
x23.610
x32.245.10
x44.2415.390

极大距离

Lx1x2x3x4
x10
x230
x3250
x43150

余弦相似度

c o s ( o i , o j ) = ∑ k = 1 n ( x i k ⋅ x j k ) ∑ l = 1 n x i l 2 ⋅ ∑ l = 1 n x j l 2 cos(o_{i},o_{j})=\frac{\sum_{k=1}^{n}(x_{ik}\cdot x_{jk})}{\sqrt{\sum_{l=1}^{n}x_{il}^2}\cdot \sqrt{\sum_{l=1}^{n}x_{jl}^2}} cos(oi,oj)=l=1nxil2 l=1nxjl2 k=1n(xikxjk)

InstanceTeamCoachHockeyBaseballSoccerPenaltyScoreWinLossSeason
instance15030200200
instance23020110101

cos(instance1,instance2)
= 5 ∗ 3 + 0 ∗ 0 + 3 ∗ 2 + 0 ∗ 0 + 2 ∗ 1 + 0 ∗ 1 + 2 ∗ 1 + 0 ∗ 0 + 0 ∗ 1 ( 25 + 9 + 4 + 4 ) 0.5 ∗ ( 9 + 4 + 1 + 1 + 1 + 1 ) 0.5 \frac{5*3+0*0+3*2+0*0+2*1+0*1+2*1+0*0+0*1}{(25+9+4+4)^{0.5}*(9+4+1+1+1+1)^{0.5}} (25+9+4+4)0.5(9+4+1+1+1+1)0.553+00+32+00+21+01+21+00+01=0.94

▶余弦相似度与欧氏距离的对比:
●衡量角度不同:
        欧氏距离:绝对距离
        余弦相似度:方向差异
●适应模型不同:
        欧氏距离:数值特征绝对差异,用于需要从维度的数值大小中体现差异的分析,如使用用户行为指标分析用户价值的相似度或差异
        余弦相似度:对绝对数值不敏感,用于使用用户对内容评分来区分用户兴趣的相似度和差异

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值