机器学习中用到的一些距离

原创 2015年04月10日 13:44:29

       机器学习算法中常常需要使用数据之间的距离来标识两组数据之间的差异,比如k-近邻算法等。本文将介绍经常使用几种距离的概念、计算公式和应用。
       这些距包括:
1. 闵可夫斯基距离
2. 欧几里得距离
3. 曼哈顿距离
4. 切比雪夫距离
5. 马氏距离
6. 余弦相似度
7. 皮尔逊相关系数
8. 汉明距离
9. 杰卡德相似系数
10. 编辑距离
11. DTW 距离
12. KL 散度

1.闵可夫斯基距离

       首先介绍闵可夫斯基这个人。闵可夫斯基是俄裔德国数学家,是爱因斯坦在某大学时的数学老师,也是最早提出狭义相对论中由一个时间维和三个空间维组成的时空的人。
       闵可夫斯基的计算公式是:
这里写图片描述
       上面公式中x和y分别表示需要比较的两组数据。p是一个可变的值,当p取1时,公式表达的是哈密顿距离。当p取2时,公式表示的欧几里的距离。当p的值趋向于闵可夫斯基距离转化成切比雪夫距离。

2.欧几里得距离

欧几里的距离是比较常用的距离
未完待续……

曼哈顿距离和欧氏距离比较

曼哈顿距离 是由十九世纪的赫尔曼·闵可夫斯基所创词汇 ,是种使用在几何度量空间的几何学用语,用以标明两个点在标准坐标系上的绝对轴距总和。 出租车几何或曼哈顿距离(Manhattan Dis...
  • u011470356
  • u011470356
  • 2014年03月24日 11:16
  • 2295

平面最远哈密顿距离

题目:http://poj.org/problem?id=2926   分析:哈密顿距离定义是:对于二维平面上的两点A,B,其坐标分别为:,,那么它们的哈密顿距离D表示为:   ,去掉绝对值符...
  • ACdreamers
  • ACdreamers
  • 2013年10月15日 15:39
  • 2393

POJ.2926 平面最远哈密顿距离

【题意】点击打开链接 【解题方法】哈密顿距离定义是:对于二维平面上的两点A,B,其坐标分别为:,,那么它们的哈密顿距离D表示为:   ,去掉绝对值符号,有以下四种情况:     然...
  • just_sort
  • just_sort
  • 2016年07月31日 19:19
  • 402

机器学习中用到的各种距离

在做分类时常常需要估算不同样本之间的相似性(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。 采用什么样的方法计算距离是很讲究,甚至关...
  • huahaitingyuan
  • huahaitingyuan
  • 2014年10月14日 10:58
  • 431

欧氏距离与马氏距离的优缺点是什么?

欧氏距离与马氏距离的优缺点是什么?       欧氏距离(Euclidean distance)也称欧几里得度量、欧几里得度量,是一个通常采用的距离定义,它是在m维空间中两个点之间的真实距离。在二维...
  • Maybe2030
  • Maybe2030
  • 2015年03月12日 20:36
  • 12526

曼哈顿距离,欧式距离,余弦距离

1.曼哈顿距离 曼哈顿距离又称马氏距离(Manhattan distance),还见到过更加形象的,叫出租车距离的。具见上图黄线,应该就能明白。 计算距离最简单的方法是曼哈顿距离。假设...
  • qingyang666
  • qingyang666
  • 2017年03月13日 16:11
  • 1937

欧式距离、标准化欧式距离、马氏距离、余弦距离

#### 目录 - 欧氏距离 - 标准化欧氏距离 - 马氏距离 - 夹角余弦距离 - 汉明距离 - 曼哈顿(Manhattan)距离1.欧式距离欧式距离源自N维欧氏空间中两点x1,x2x_...
  • Kevin_cc98
  • Kevin_cc98
  • 2017年06月26日 17:15
  • 3741

曼哈顿距离,欧式距离,明式距离,切比雪夫距离,汉明距离

曼哈顿距离,欧式距离,明式距离,切比雪夫距离区别
  • jacke121
  • jacke121
  • 2017年01月17日 18:42
  • 1244

基于距离变换和分水岭算法的图像分割(图像变换 )

// 加载图像 Mat src = imread("../data/cards.png"); // 成功加载 if (!src.data) return -1; ...
  • chaihuimin
  • chaihuimin
  • 2017年08月04日 17:45
  • 475

[转][译]一种度量准则:推土机距离Earth Mover's Distance(EMD)

在计算机科学与技术中,地球移动距离(EMD)是一种在D区域两个概率分布距离的度量,就是被熟知的Wasserstein度量标准。不正式的说,如果两个分布被看作在D区域上两种不同方式堆积一定数量的山堆,那...
  • liyuefeilong
  • liyuefeilong
  • 2015年05月21日 14:58
  • 6603
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:机器学习中用到的一些距离
举报原因:
原因补充:

(最多只允许输入30个字)