聚类分析(一)

本文介绍了系统聚类分析的基本概念,包括Q型和R型聚类分析,详细讲解了系统聚类法的步骤和数据要求。同时,探讨了样品间的距离和相似系数,如明氏距离、兰氏距离、斜交空间距离、马氏距离和相似系数,并列举了八种不同的系统聚类方法,如最短距离法、最长距离法和类平均法等。
摘要由CSDN通过智能技术生成

聚类分析(一)

一、系统聚类含义

\qquad 聚类分析一般分为Q型聚类分析和R型聚类分析。Q型聚类分析是指对样品进行聚类分析,R型聚类分析是指对变量进行聚类。根据处理方法的不同聚类分析又分为系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法。
\qquad 系统聚类法一般步骤如下:
\qquad 1、将每一个样本(或指标)当做单独的一个类,计算每两个类之间的距离;
\qquad 2、将距离最小的两类作为一个新的类,新的类的值根据不同的处理方法计算得出,然后计算每一个类之间的距离。
\qquad 3、重复步骤2,直至所有样本(或指标)全部聚合成一类。
\qquad 4、按照不同的处理方确定分类数的方法,并进行分类。

二、数据要求

\qquad (一)样本与样本之间无顺序可言;
\qquad (二)样本数据无缺失值;
\qquad (三)样本数据是数值型的数据。
\qquad (四)常见的数据变换方法:
\qquad 1.中心变换: x i j = x i j − x j ‾ x_{ij}=x_{ij}-\overline{x_j} xij=xijxj,变换之后新坐标的原点与样本的重心重合,而样本的相对位置没有变。
\qquad 2.标准化变换: x i j = x i j − x j ‾ S j x_{ij}=\frac{x_{ij}-\overline{x_j}}{S_j} xij=Sjxijxj,变换之后每个变量的样本均值为0,标准差为1,而且变换后的数据与量纲无关。
\qquad 3.极差正规化变换: x i j ∗ = x i j − m i n 1 ≤ i ≤ n x i j R j x_{ij}^*=\frac{x_{ij}-min_{1\le i\le n}x_{ij}}{R_j} xij=Rjxijmin1inxij,变换后数据的在取值范围在[0,1],与量纲无关。

\qquad 4.对数变换: x i j ∗ = l o g ( x i j ) x_{ij}^*=log(x_{ij}) xij=log(xij)
\qquad 其中:
x ‾ = 1 n ∑ i = 1 n x i j ( j = 1 , 2 , . . . , p ) \overline{x}=\frac{1}{n}\sum_{i=1}^nx_{ij}(j=1,2,...,p) x=n1i=1nxij(j=1,2,...,p)

S j = 1 n ∑ i = 1 n ( x i j − x j ‾ ) 2 ( j = 1 , 2 , . . . , p ) S_j=\sqrt{\frac{1}{n}\sum_{i=1}^n(x_{ij}-\overline{x_j})^2}\quad (j=1,2,...,p) Sj=n1i=1n(xijxj)2 (j=1,2,...,p)

R j = m a x i = 1 , 2 , . . . , p x i j − m i n i = 1 , 2 , . . . , p x i j R_j=max_{i=1,2,...,p}x_{ij}-min_{i=1,2,...,p}x_{ij} Rj=maxi=1,2,...,pxijmini=1,2,...,pxij

三、样品间的距离和相似系数

\qquad 如果把 n n n个样品( X X X中的 n n n个行)看成 p p p维空间中的 n n n个点,则两个样品之间样品的相似程度可用 n n n维空间中两点的距离来度量。令 d i j d_{ij} dij表示样品 X ( i ) X_{(i)} X(i) X ( j ) X_{(j)} X(j)的距离。常用的距离有:

\qquad (一)明氏距离

d i j ( q ) = ( ∑ a = 1 p ∣ x i a − x j a ∣ q ) 1 / q d_{ij}(q)=(\sum_{a=1}^p|x_{ia}-x_{ja}|^q)^{1/q} dij(q)=(a=1pxiaxjaq)1/q

\qquad q = 1 q=1 q=1时:
d i j ( 1 ) = ∑ a = 1 p ∣ x i a − x j a ∣ 即 绝 对 距 离 d_{ij}(1)=\sum_{a=1}^p|x_{ia}-x_{ja}|\quad即绝对距离 d

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值