无监督学习——距离度量

最新推荐文章于 2022-09-04 15:19:11 发布

nijun1992

最新推荐文章于 2022-09-04 15:19:11 发布

阅读量2.7k

点赞数

分类专栏：机器学习文章标签：无监督学习距离计算

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/nijun1992/article/details/89535681

版权

机器学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

距离度量(distance measure)函数dist(∙,∙)满足的一般性质：

非负性：dist(xi,xj)≥0；
同一性：dist(xi,xj)=0，当且仅当xi=xj；
对称性：dist(xi,xj)=dist(xj,xi), ；
直递性：dist(xi,xj)≤dist(xi,xk)+dist(xk,xj), .

常用的距离度量方法是闵可夫斯基距离(Minkowski distance)距离度量法，一般表示为：

（1）

式中p≥0, p=2即为欧式距离（Euclidean distance），p=1时即为曼哈顿距离（Manhattan distance）。通常情况下，样本属性可分为“有序属性”（ordinal attribute）和“无序属性”（non-ordinal attribute），“有序属性”的属性值之间的距离具有一定的连续属性，能够直接在属性值上计算距离，因此，从一定意义上来讲，闵可夫斯基距离通常用于有序属性。而无序属性可用VDM（Value Difference Metric）[Stanfill and Waltz, 1986]，其表示为：

（2）

式中，表示属性在上取值为a的样本数，表示在第i个样本簇中在属性u上取值为a的样本数，k为样本簇数目，a和b分别表示两种不同的离散值。

当样本中不同属性的重要性不同时，可以使用“加权距离”（weight distance），以加权“闵可夫斯基距离”(Minkowski distance)为例:

（3）

其中权重 (i=1,2,…,n)，。

参考自周志华《机器学习》

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
无监督学习——距离度量

距离度量(distance measure)函数dist(∙,∙)满足的一般性质：非负性：dist(xi,xj)≥0；同一性：dist(xi,xj)=0，当且仅当xi=xj；对称性：dist(xi,xj)=dist(xj,xi),；直递性：dist(xi,xj)≤dist(xi,xk)+dist(xk,xj),.常用的距离度量方法是闵可夫斯基距离(Minkowski dis...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。