R中的聚类分析:确定最佳聚类数-

最新推荐文章于 2024-08-14 14:57:41 发布

Mrrunsen

最新推荐文章于 2024-08-14 14:57:41 发布

阅读量379

点赞数

分类专栏： R语言大学作业文章标签：聚类 r语言

本文链接：https://blog.csdn.net/Mrrunsen/article/details/128929331

版权

R语言大学作业专栏收录该内容

1394 篇文章 6147 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

本文探讨了在R中进行聚类分析时如何选择最佳的聚类数，特别是在k-means分析中。通过分析误差平方和（SSE）曲线、进行聚类树分析、应用卡林斯基准则以及利用期望最大化（EM）的贝叶斯信息标准，可以判断合适的数据分组数量。同时推荐使用特定的R库来辅助确定最佳聚类数。

摘要由CSDN通过智能技术生成

R中的聚类分析:确定最佳聚类数-

如何选择最佳的聚类数来做k-means分析？绘制以下数据的子集后，多少个聚类是合适的？如何进行聚类树分析？

n = 1000
kk = 10    
x1 = runif(kk)
y1 = runif(kk)
z1 = runif(kk)    
x4 = sample(x1,length(x1))
y4 = sample(y1,length(y1)) 
randObs <- function()
{
  ix = sample( 1:length(x4), 1 )
  iy = sample( 1:length(y4), 1 )
  rx = rnorm( 1, x4[ix], runif(1)/8 )
  ry = rnorm( 1, y4[ix], runif(1)/8 )
  return( c(rx,ry) )
}  
x = c()
y = c()
for ( k in 1:n )
{
  rPair  =  randObs()
  x  =  c( x, rPair[1] )
  y  =  c( y, rPair[2] )
}
z <- rnorm(n)
d <- data.frame( x, y, z )

如果你的问题是"如何确定有多少个聚类适合对我的数据进行kmeans分析？“，那么这里有一些选择。

首先，一些可再现的数据(Q中的数据是…我不清楚):

n = 100
g = 6 
set.seed(g)
d <- data.frame(x = unlist(lapply(1:g, function(i) rnorm(n/g, runif(1)*i^2))), 
                y = unlist(lapply(1:g, f

了解本专栏

超级会员免费看

Mrrunsen

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
R中的聚类分析:确定最佳聚类数-

根据期望最大化的贝叶斯信息标准来确定最佳模型和聚类数，该期望最大化的贝叶斯信息标准由参数化高斯混合模型的分层聚类来初始化。如何选择最佳的聚类数来做k-means分析？绘制以下数据的子集后，多少个聚类是合适的？如何进行聚类树分析？您可以更改聚类方法和计算最佳组数的方法。卡林斯基准则:另一种诊断有多少聚类适合数据的方法。在这种情况下，我们尝试1到10组。如何确定有多少个聚类适合对我的数据进行kmeans分析？首先，一些可再现的数据(Q中的数据是…“，那么这里有一些选择。fpc封装中的功能。
复制链接

扫一扫