多元统计分析最短距离法_多元统计分析-聚类分析

最新推荐文章于 2023-01-27 19:26:42 发布

VIP文章小六不是六

最新推荐文章于 2023-01-27 19:26:42 发布

阅读量1w

点赞数 1

文章标签：多元统计分析最短距离法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_30748871/article/details/112015321

版权

聚类分析是一个迭代的过程

对于n个p维数据，我们最开始将他们分为n组

每次迭代将距离最近的两组合并成一组

若给出需要聚成k类，则迭代到k类是，停止

计算初始情况的距离矩阵一般用马氏距离或欧式距离

个人认为考试只考 1,2

比较有用的方法是3,4,5,8

最喜欢第8种

距离的计算

欧式距离

距离的二范数

马氏距离

对于X1, X2 均属于N(u, Σ)

X1,X2的距离为 (X1 - X2) / sqrt(Σ)

那么不同的聚类方法其实也就是不同的计算类间距离的方法

1.最短距离法

计算两组间距离时，将两组间距离最短的元素作为两组间的距离

2.最长距离法

将两组间最长的距离作为两组间的距离

3.中间距离法

将Gp,Gq合并成为Gr

计算Gr与Gk的距离时使用如下公式

D2kr = 1/2 * D2kp + 1/2 * D2kq + β * D2pq

β是提前给定的超参数-0.25<=β<=0

4.重心法

每一组都可以看成一组多为空间中点的集合，计算组间距离时，可使用这两组点的重心之间的距离作为类间距离

若使用的是欧氏距离

那么有如下计算公式

D2kr = np/nr * D2kp + nq/nr * D2kq - (np*nq / nr*nr ) * D2pq

5.类平均法

两组之间的距离 = 组间每两个样本距离平方的平均值开根号

表达式为D2kr = np/nr * D2kp &#

最低0.47元/天解锁文章

小六不是六

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
多元统计分析最短距离法_多元统计分析-聚类分析

聚类分析是一个迭代的过程对于n个p维数据，我们最开始将他们分为n组每次迭代将距离最近的两组合并成一组若给出需要聚成k类，则迭代到k类是，停止计算初始情况的距离矩阵一般用马氏距离或欧式距离个人认为考试只考 1,2比较有用的方法是3,4,5,8最喜欢第8种距离的计算欧式距离距离的二范数马氏距离对于X1, X2 均属于N(u, Σ)X1,X2的距离为 (X1 - X2) / sqrt(Σ)那么不同...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。