距离度量与相似度度量

本文详细介绍了距离度量与相似度度量在机器学习中的应用,包括距离的定义及其与相似度的关系,重点讲解了马氏距离、余弦相似度、相关系数、KL散度、JS距离和MMD距离的概念、公式及特性,这些度量方法在不同的场景下具有不同的优缺点和适用性。
摘要由CSDN通过智能技术生成

概述

      在分类和聚类任务中,需要用到距离度量评估样本之间的相似度。

      距离度量方法需要满足:1)样本到自身的距离为0;2)距离满足非负性;3)对称性,即A到B的距离与B到A的距离相同;4)三角形法则,即两边和大于第三边。

      距离度量的选择会影响到分类或聚类算法的效果,这里总结一些常见的距离度量方法。


 

一、L_{p}距离 

      L_{p}距离是在论文中最常出现的距离度量方式之一,距离越大相似度越小。直白地说,L_{p}距离就是对两个样本在每个维度上的差距取p次方后求和并开p次方根(p≥1)。 

      L_{p}距离越大,相似度越小。 

      在特征空间X中取两个n维实数向量x_{i}x_{j}x_{i}=\left \{ x_{i}^{1}, x_{i}^{2},..., x_{i}^{n} \right \},x_{j}=\left \{ x_{j}^{1},x_{j}^{2},...,x_{j}^{n} \right \}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值