R语言:聚类分析hclust

# 生成测试数据
# 产生0-1之间均匀分布Uniform Distribution的数值
x = runif(10)
y = runif(10)
# 得到2维的数组:按列合并
S = cbind(x,y)
# 赋予名称,便于识别分类:生成Name1-Name10的系列名赋予数组行名
rownames(S) = paste("Name",1:10,"")

# 数值计算距离
out.dist=dist(S,method="euclidean")
# 注释:在聚类中求两点的距离有:
# 1,绝对距离:manhattan
# 2,欧氏距离:euclidean 默认
# 3,闵科夫斯基距离:minkowski
# 4,切比雪夫距离:chebyshev
# 5,马氏距离:mahalanobis
# 6,蓝氏距离:canberra

# 根据距离聚类
out.hclust=hclust(out.dist,method="complete")
# 注释:聚类中集合之间的距离:
# 1,类平均法:average
# 2,重心法:centroid
# 3,中间距离法:median
# 4,最长距离法:complete 默认
# 5,最短距离法:single
# 6,离差平方和法:ward
# 7,密度估计法:density

# 聚类结果绘图
plclust(out.hclust)

plclust有的版本不认别,可用plot代替

image

# 添加聚类分类矩形,如分为3类
rect.hclust(out.hclust, k=3) 

image

# 得到分为3类的数值
out.id = cutree(out.hclust, k=3)
out.id
# 以矩阵的方式分辨名称对应的类
table(out.id,paste("Name",1:10,""))   

image
直接返回的样本对应分组列表,可用table转换为矩阵格式

猜你喜欢

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外2400+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。
image

学习扩增子、宏基因组科研思路和分析实战,关注“宏基因组”
image

image

点击阅读原文,跳转最新文章目录阅读
https://mp.weixin.qq.com/s/5jQspEvH5_4Xmart22gjMA

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值