明可夫斯基距离和马氏距离

本文介绍了机器学习中常用的两种距离度量——明可夫斯基距离和马氏距离。明可夫斯基距离包括曼哈顿距离、欧式距离和切比雪夫距离,对异常值敏感。马氏距离则通过协方差矩阵消除单位和数据变异影响,适用于处理变量变异程度不同的情况,但计算复杂。
摘要由CSDN通过智能技术生成

       在机器学习中,距离是一个非常形象并且常用的概念。在分类和聚类问题中,距离的作用尤为明显。除此之外,在回归问题,甚至自然语言处理问题上,距离也有其相应的应用。

       除了距离之外,相似系数也是解决这一问题的方法之一,显而易见,距离和相似系数应该呈反比,距离越小越相似;距离越大越不同。距离主要是对不同的观测进行度量,相似系数主要是对不同的变量进行度量。但是,距离也可以衡量不同的变量,同理,相似系数也可以衡量不同的观测。

       本文将介绍距离的定义,并详细介绍两种非常常用的距离:明可夫斯基距离和马氏距离。在后文中,我们将介绍相似系数

距离定义

       设两个n维向量 x ⃗ = ( x 1 , x 2 , ⋯   , x n ) T \vec{x} = (x_1,x_2,\cdots,x_n)^T x =(x1,x2,,xn)T y ⃗ = ( y 1 , y 2 , ⋯   , y n ) T \vec{y} = (y_1,y_2,\cdots,y_n)^T y =(y1,y2,,yn)T为两个观测,其所定义的距离一般需要满足三个条件:

  1. 非负性: d ( x ⃗ , y ⃗ ) ≥ 0 d(\vec{x},\vec{y}) ≥ 0 d(x ,y )0 d ( x ⃗ , y ⃗ ) = 0 d(\vec{x},\vec{y}) = 0 d(x ,y )=0当且仅当 x ⃗ = y ⃗ \vec{x} = \vec{y} x =y
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值