r read.csv删除左侧序号_简单好用:手把手教你用R语言实现聚类分析

本文详细介绍了如何在R语言中进行聚类分析,包括计算距离/不相似矩阵,使用hclust()进行谱系聚类,并通过实例展示了聚类过程和结果可视化,便于理解和应用。
摘要由CSDN通过智能技术生成

本文将详细介绍如何运用R语言进行聚类分析,包括直接从原始数据中聚类和根据距离矩阵进行聚类,并附有聚类结果可视化教程,教程非常详细,即学即用。

距离/不相似矩阵计算

  • 加载数据
data(iris)str(iris)
d4b4796554d3aa1054deba7a5816392e.png

输出

聚类分析是无监督的分类,删除数据中给定原始分类,最后可以将聚类的结果给定的分类做一个比较,定量地看看聚类的性能怎么样。

iris$Species
  • 不相似矩阵计算

不相似矩阵计算,也就是距离矩阵计算,在R中采用 dist()函数,或者 cluster表中的 daisy()函数。 dist()函数的基本形式是:

dist(x, method = "euclidean", diag = FALSE, upper = FALSE, p = 2)

其中 x是数据框(数据集),而方法可以指定为欧式距离 "euclidean", 最大距离 "maximum", 绝对值距离 "manhattan"和明氏距离 "minkowski"等。默认是计算欧式距离,所有的属性必须是相同的类型。比如都是连续类型,或者都是二值类型。

dd
f3c6f05347800ecbb10d5f09ca10ac8d.png

输出

距离矩阵可以使用 as.matrix()函数转化为矩阵的形式,方便显示。

dd
c5af4a7fa132b6dea20c42f58d5399dc.png
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值