机器学习—聚类(一)(L—P范数/闽可夫斯基距离/马氏距离/相关系数/夹角余弦)

本文介绍了机器学习中常用的样本间距离和相似度度量方法,包括L-0、L-1、L-2、L-∞范数,闽可夫斯基距离,马哈拉诺比斯距离,相关系数和夹角余弦。这些度量在数据挖掘和算法中用于表示样本差异和相似性。
摘要由CSDN通过智能技术生成

机器学习中用样本之间的距离/相似度来表示样本差异,下面介绍几种常用的距离/相似度,顺便介绍一下L—P范数。

1.闽可夫斯基距离

L—P范数与闽可夫斯基距离的定义一样:
L p = ( ∑ 1 n x i p ) 1 p , x = ( x 1 , x 2 , ⋯   , x n ) Lp=({\sum\limits_{1}^n x_i^p})^{\frac{1}{p}},x=(x_1,x_2,\cdots,x_n) Lp=(1nxip)p1x=(x1,x2,,xn)

  • p = 1 p=1 p=1时,称为曼哈顿距离
  • p = 2 p=2 p=2时,称为欧氏距离
  • p = ∞ p =\infty p=时,称为切比雪夫距离,取各个坐标数值差的绝对值的最大值 d i j = m a x k   ∣ x k i   −   x k j ∣ d_{ij}= max_k \ |x_{ki}\ - \ x_{kj}| dij=maxk xki  xkj

p p p变化时,范数也有着不同的变化,三维空间中到原点距离小于一的点构成一个球体,即欧氏距离。
在这里插入图片描述

1.1L-0范数

对于L—0范数来说,他用来度量向量中非0元素的个数,表现形式为 ∣ ∣ w ∣ ∣ 0 ||w||_0 w0

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值