【统计分析数学模型】聚类分析：系统聚类法-CSDN博客

本文链接：https://blog.csdn.net/weixin_43645790/article/details/136219263

在这里插入图片描述

一、聚类分析

聚类分析（Cluster Analysis） 是研究“物以类聚”的一种方法，有时称为群分析、点群分析、簇类分析等。

聚类分析是根据研究对象的特征对研究对象进行分类的多元分析技术的总称。聚类分析是应用最广泛的分类技术，它把性质相近的个体归为一类，使同一类的个体具有高度的同质性。

聚类分析大部分都属于探测性研究，最终结果是产生研究对象的分类，通过对数据的分类研究还能产生假设。聚类分析也可用于证实性目的，对于通过其他方法确定的数据分类，可以应用聚类分析进行检验。

相似性度量包括：距离和相似系数.
样品之间的距离和相似系数有着各种不同的定义，而这些定义与变量的类型有着非常密切的关系.

变量的测量尺度：间隔、有序和名义尺度.

常用的距离包括：

dist(x, method = "euclidean", diag = FALSE, upper = FALSE, p = 2)

其中参数含义：

参数	含义
X	数据矩阵
method	距离计算方法包括"euclidean", "maximum“, “manhattan”, “canberra”, “binary” or “minkowski”
diag	是否包含对角线元素
upper	是否需要矩阵上三角
p	Minkowski距离的幂次

示例：

X=c(1,2,6,8,11)
dist(X,diag=1,upper=1)

运行结果如下：

   1  2  3  4  5
1  0  1  5  7 10
2  1  0  4  6  9
3  5  4  0  2  5
4  7  <