[R]指令总结-hclust层次聚类包

【R 层次聚类--hclust包】
http://blog.csdn.net/sherrymi/article/details/38341185


hclust(d, method = "complete", members=NULL)
d为距离矩阵。
method表示类的合并方法,有:
single            最短距离法
complete        最长距离法
median        中间距离法
mcquitty        相似法
average        类平均法
centroid        重心法
ward            离差平方和法


#'举例
d <- dist(x)
hc <- hclust(d,"single")
plot(hc)


#'然后可以用rect.hclust(tree, k = NULL, which = NULL, x = NULL, h = NULL,border = 2, cluster = NULL)来确定类的个数。 #'tree就是求出来的对象。k为分类的个数,h为类间距离的阈值。border是画出来的颜色,用来分类的。
rect.hclust(hc,k=2)
rect.hclust(hc,h=0.5)


#'提取每个样本所属的类别
label <- cutree(hc,k=2)
  • 1
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
K-means、系统层次聚类和DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是常见的聚类方法,它们在算法原理和应用场景上有一些区别和联系。 1. K-means聚类: - 原理:K-means是一种基于距离的聚类方法,将数据集划分为K个簇,每个簇以其质心(簇中所有样本的均值)来表示。算法迭代地更新簇的质心,直到质心不再改变或达到预定的停止条件。 - 特点: - 需要事先指定簇的数量K。 - 对于高维数据和非凸形状的簇效果可能较差。 - 对噪声和异常值敏感。 - 适用场景:适用于数据集具有明显的簇结构、簇数已知或可估计的情况。 2. 系统层次聚类: - 原理:系统层次聚类是一种层次化的聚类方法,通过计算样本间的相似性构建一个层次结构。可以采用凝聚(自底向上)或分裂(自顶向下)策略。凝聚式方法从每个样本作为一个初始簇开始,逐步合并最接近的簇,直到达到停止条件。 - 特点: - 不需要预先指定簇的数量。 - 生成层次结构,可以根据需要选择合适的簇数。 - 对于离群点和噪声的鲁棒性较好。 - 适用场景:适用于数据集没有明显的簇结构、簇数不确定或希望在不同层次上进行分析的情况。 3. DBSCAN聚类: - 原理:DBSCAN是一种基于密度的聚类方法,通过定义样本点周围的密度来确定簇的边界。该算法将高密度区域看作是簇的一部分,可以自动识别任意形状的簇,并且能够识别噪声点。 - 特点: - 不需要预先指定簇的数量。 - 能够处理任意形状的簇,对噪声和异常值有较好的鲁棒性。 - 对参数设置(如半径和邻域密度)敏感。 - 适用场景:适用于数据集具有不规则形状、噪声较多或簇大小差异较大的情况。 联系: - K-means和系统层次聚类都是基于距离度量的方法,而DBSCAN是基于密度的方法。 - K-means和系统层次聚类需要预先指定簇的数量,而DBSCAN不需要。 - K-means和DBSCAN对噪声和异常值较为敏感,而系统层次聚类相对较为鲁棒。 - 系统层次聚类可以生成一个层次结构,而K-means和DBSCAN生成固定数量的簇。 总之,这三种聚类方法在原理和适用场景上有所区别,选择合适的方法取决于数据的特点和聚类的目标。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值