机器学习中的相似性度量

本文详细介绍了机器学习中常见的相似性度量方法,包括欧氏距离、曼哈顿距离、切比雪夫距离、闵可夫斯基距离、标准化欧氏距离、马氏距离、夹角余弦、汉明距离、杰卡德距离、相关系数和信息熵等,讨论了它们的计算方法、适用场景及优缺点。举例说明了在Matlab中如何计算这些距离,并对比了欧氏距离和余弦相似度在衡量个体差异时的差异。
摘要由CSDN通过智能技术生成

分享一下我老师大神的人工智能教程!零基础,通俗易懂!http://blog.csdn.net/jiangjunshow

也欢迎大家转载本篇文章。分享知识,造福人民,实现我们中华民族伟大复兴!

               

机器学习中的相似性度量

  在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。

  本文的目的就是对常用的相似性度量作一个总结。

  本文目录:

  1. 欧氏距离

  2. 曼哈顿距离

  3. 切比雪夫距离

  4. 闵可夫斯基距离

  5. 标准化欧氏距离

  6. 马氏距离

  7. 夹角余弦

  8. 汉明距离

  9. 杰卡德距离 & 杰卡德相似系数

  10. 相关系数 & 相关距离

  11. 信息熵

1. 欧氏距离(Euclidean Distance)

       欧氏距离是最易于理解的一种距离计算方法,源自欧氏空间中两点间的距离公式。

  (1)二维平面上两点a(x1,y1)与b(x2,y2)间的欧氏距离:

  (2)三维空间两点a(x1,y1,z1)与b(x2,y2,z2)间的欧氏距离:

  (3)两个n维向量a(x11,x12,…,x1n)与 b(x21,x22,…,x2n)间的欧氏距离:

  也可以用表示成向量运算的形式:

  (4)Matlab计算欧氏距离

  Matlab计算距离主要使用pdist函数。若X是一个M×N的矩阵,则pdist(X)将X矩阵M行的每一行作为一个N维向量,然后计算这M个向量两两间的距离。

  例子:计算向量(0,0)、(1,0)、(0,2)两两间的欧式距离

  X = [0 0 ; 1 0 ; 0 2]

  D = pdist(X,'euclidean')

  结果:

  D =1.0000    2.0000    2.2361

2. 曼哈顿距离(Manhattan Distance)

       从名字就可以猜出这种距离的计算方法了。想象你在曼哈顿要从一个十字路口开车到另外一个十字路口,驾驶距离是两点间的直线距离吗?显然不是,除非你能穿越大楼。实际驾驶距离就是这个“曼哈顿距离”。而这也是曼哈顿距离名称的来源, 曼哈顿距离也称为城市街区距离(City Block distance)

  (1)二维平面两点a(x1,y1)与b(x2,y2)间的曼哈顿距离

  (2)两个n维向量a(x11,x12,…,x1n)与 b(x21,x22,…,x2n)间的曼哈顿距离

  (3) Matlab计算曼哈顿距离

  例子:计算向量(0,0)、(1,0)、(0,2)两两间的曼哈顿距离

  X = [0 0 ; 1 0 ; 0 2]

  D = pdist(X, 'cityblock')

  结果:

  D = 1     2     3

3. 切比雪夫距离 ( Chebyshev Distance )

       国际象棋玩过么?国王走一步能够移动到相邻的8个方格中的任意一个。那么国王从格子(x1,y1)走到格子(x2,y2)最少需要多少步?自己走走试试。你会发现最少步数总是max( | x2-x1 | , | y2-y1 | ) 步 。有一种类似的一种距离度量方法叫切比雪夫距离。

  (1)二维平面两点a(x1,y1)与b(x2,y2)间的切比雪夫距离

  (2)两个n维向量a(x11,x12,…,x1n)与 b(x21,x22,…,x2n)间的切比雪夫距离

  这个公式的另一种等价形式是

       看不出两个公式是等价的?提示一下:试试用放缩法和夹逼法则来证明。

  (3)Matlab计算切比雪夫距离

  例子:计算向量(0,0)、(1,0)、(0,2)两两间的切比雪夫距离

  X = [0 0 ; 1 0 ; 0 2]

  D = pdist(X, 'chebychev')

  结果:

  D = 1     2     2

4. 闵可夫斯基距离(Minkowski Distance)

  闵氏距离不是一种距离,而是一组距离的定义。

  (1) 闵氏距离的定义

       两个n维变量a(x11,x12,…,x1n)与 b(x21,x22,…,x2n)间的闵可夫斯基距离定义为:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值