r语言聚类求和_R语言的三种聚类方法

最新推荐文章于 2023-02-16 10:01:58 发布

weixin_39695374

最新推荐文章于 2023-02-16 10:01:58 发布

阅读量668

点赞数

文章标签： r语言聚类求和

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39695374/article/details/111839415

版权

一、层次聚类

1)距离和相似系数

r语言中使用dist(x, method = “euclidean”,diag = FALSE, upper = FALSE, p = 2) 来计算距离。其中x是样本矩阵或者数据框。method表示计算哪种距离。method的取值有：

euclidean 欧几里德距离，就是平方再开方

maximum 切比雪夫距离

manhattan 绝对值距离

canberra Lance 距离

minkowski 明科夫斯基距离，使用时要指定p值

binary 定性变量距离.

定性变量距离：记m个项目里面的 0:0配对数为m0 ,1:1配对数为m1，不能配对数为m2，距离=m1/(m1+m2);

diag 为TRUE的时候给出对角线上的距离。upper为TURE的时候给出上三角矩阵上的值。

r语言中使用scale(x, center = TRUE, scale = TRUE) 对数据矩阵做中心化和标准化变换。

如只中心化 scale(x,scale=F) ,

r语言中使用sweep(x, MARGIN, STATS, FUN=”-“, …) 对矩阵进行运算。MARGIN为1，表示行的方向上进行运算，为2表示列的方向上运算。STATS是运算的参数。FUN为运算函数，默认是减法。下面利用sweep对矩阵x进行极差标准化变换

有时候我们不是对样本进行分类，而是对变量进行分类。这时候，我们不计算距离，而是计算变量

最低0.47元/天解锁文章

weixin_39695374

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
r语言聚类求和_R语言的三种聚类方法

一、层次聚类1)距离和相似系数r语言中使用dist(x, method = “euclidean”,diag = FALSE, upper = FALSE, p = 2) 来计算距离。其中x是样本矩阵或者数据框。method表示计算哪种距离。method的取值有：euclidean 欧几里德距离，就是平方再开方maximum 切比雪夫距离manhattan 绝对值距离canberra Lance ...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。