Gap Statistic 间隔统计量

最新推荐文章于 2024-08-08 07:52:47 发布

Tongust

最新推荐文章于 2024-08-08 07:52:47 发布

阅读量2.4w

点赞数 17

分类专栏： ML

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/baidu_17640849/article/details/70769555

版权

Gap Statistic是一种由Tibshirani等人提出的用于聚类问题中确定最佳类别数目的方法。它通过比较聚类的紧支测度（Dk）和参考直的测度来工作。Python实现中，通过对数据进行Monte Carlo采样得到参考直，测试结果显示理想的k值为3。

摘要由CSDN通过智能技术生成

Gap Statistic

Gap Statistic

Gap statistic由Tibshirani等人提出，用以解决聚类问题确定所判定类的数目。

聚类的紧支测度（measure of the compactness）

最简单的方法是使用类内样本点之间的欧式距离来表示，记为 $D_k$ ， $D_K$ 越小聚类的紧支性越好。Ref

D k = \sum x i \in C k \sum x j \in C k | | x i - x j | | 2 = 2 n k \sum x

最低0.47元/天解锁文章

关注

17
点赞
踩
66

收藏

觉得还不错? 一键收藏
7
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 7

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。