R语言数据挖掘实践——系谱聚类

最新推荐文章于 2022-10-27 22:56:03 发布

技术宅也爱玩游戏

最新推荐文章于 2022-10-27 22:56:03 发布

阅读量1.1k

点赞数

文章标签： r语言数据挖掘聚类

原文链接：https://www.fgba.net/forum-56.html

版权

　　

R语言数据挖掘实践——系谱聚类

　　我们将在iris数据集上使用hclust()进行系谱聚类。

　　我们首先从iris数据集中抽取含有40条记录的一个样本呢，避免绘制聚类图像时太过拥挤，我们先从数据集中中剔除Species属性，然后在该样本上进行层次聚类。代码如下：

　　> idx <- sample(1:dim(iris)[1],40)

　　> irisSample <- iris[idx,]

　　> irisSample$Species <- NULL

　　> hc <- hclust(dist(irisSample),method="complete")

　　> plot(hc, hang=-1, labels=iris$Species[idx])

　　> rect.hclust(hc,k=3)

　　>groups <- cutree(hc, k=3)

　　

R语言数据挖掘实践——系谱聚类

　　在hclust()函数中，method参数用于选择聚类的具体算法，可供选择的有ward、single及complete等7种，默认选择complete方法。从绘制的树状图中可以看出，"setaosa"与其他两个簇的划分比较明确，而"versicolor"和"virginica"存在小范围的重叠。

技术宅也爱玩游戏

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
R语言数据挖掘实践——系谱聚类

　　　　我们将在iris数据集上使用hclust()进行系谱聚类。　　我们首先从iris数据集中抽取含有40条记录的一个样本呢，避免绘制聚类图像时太过拥挤，我们先从数据集中中剔除Species属性，然后在该样本上进行层次聚类。代码如下：　　> idx <- sample(1:dim(iris)[1],40)　　> irisSample <- iris[idx,]　　> irisSample$Species <- NULL　　> hc ..
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。