R语言中dim函数_R语言中实现层次聚类模型

最新推荐文章于 2022-11-28 17:22:00 发布

weixin_39810441

最新推荐文章于 2022-11-28 17:22:00 发布

阅读量847

点赞数

文章标签： R语言中dim函数 r语言中矩阵QR分解 r语言结构方程模型可视化

原文链接：

R语言中实现层次聚类模型tecdat.cn

大家好！在这篇文章中，我将向你展示如何在R中进行层次聚类。

什么是分层聚类？

分层聚类是一种可供选择的方法，它可以自下而上地构建层次结构，并且不需要我们事先指定聚类的数量。

该算法的工作原理如下：

将每个数据点放入其自己的群集中。

确定最近的两个群集并将它们组合成一个群集。

重复上述步骤，直到所有数据点位于一个群集中。

一旦完成，它通常由树状结构表示。

让我们看看分层聚类算法可以做得多好。我们可以使用hclust这个。hclust要求我们以距离矩阵的形式提供数据。我们可以通过使用dist。默认情况下，使用完整的链接方法。

这会生成以下树形图：

从图中我们可以看出，群集总数的最佳选择是3或4：

要做到这一点，我们可以使用所需数量的群集来切断树cutree。

现在，让我们将它与原始物种进行比较。

它看起来像算法成功地将物种setosa的所有花分为簇1，并将virginica分为簇2 。

让我们看看我们是否可以通过使用不同的连接方法更好。这一次，我们将使用平均连接方法：

这给了我们以下树状图：

我们可以看到，群集数量的两个最佳选择是3或5.让我们用cutree它来将它降到3个群集。

我们可以看到，这一次，该算法在聚类数据方面做得更好，只有6个数据点出错。

我们可以如下绘制它与原始数据进行比较：

这给了我们下面的图表：

内部颜色与外部颜色不匹配的所有点都是不正确聚类的点。

有问题联系我们！

weixin_39810441

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。