聚类分析(二)

本文详细介绍了有序样品聚类法,适用于顺序不可打乱的样本。主要探讨了最优分割法,包括类的直径定义、损失函数、递推公式以及最优解的求法,并提到确定分类数k的方法,如通过损失函数曲线拐点决定。
摘要由CSDN通过智能技术生成

一、有序样品聚类法

\qquad 对于按照一定的顺序排列且顺序不能被打乱的样本进行聚类分析,使用最优分割法。找一些分点,将有序样本划分为几个分段,每个分段看成一类。即寻找最好分割的一个依据是使得各段内部样本之间的差异最小,而各段样本之间的差异最大。

二、数据要求

\qquad (一)数据为实数,且顺序不可打乱。
\qquad (二)数据无缺失值。

三、最优分割法

\qquad 设有序样本依次是 X ( 1 ) , X ( 2 ) , . . . , X ( n ) ( X ( i ) 为 p 维 向 量 X_{(1)},X_{(2)},...,X_{(n)}(X_{(i)}为p维向量 X(1),X(2),...,X(n)(X(i)p
\qquad (一)定义类的直径
\qquad 设某一类 G G G包含的样品有: X ( i ) , X ( i + 1 ) , . . . , X ( j ) ( j > i ) X_{(i)},X_{(i+1)},...,X_{(j)}(j>i) X(i),X(i+1),...,X(j)(j>i),记:
X ‾ G = 1 j − i + 1 ∑ t = i j X ( t ) \overline{X}_G=\frac{1}{j-i+1}\sum_{t=i}^jX_{(t)} XG=ji+11t=ijX(t)
\qquad D ( i , j ) D(i,j) D(i,j)表示这一类的直径,常用的直径有:
D ( i , j ) = ∑ t = i j ( X ( t ) − X ‾ G ) ′ ( X ( t ) − X ‾ G ) D(i,j)=\sum_{t=i}^j(X_{(t)}-\overline{X}_G)'(X_{(t)}-\overline{X}_G) D(i,j)=t=ij(X(t)XG)(X(t)

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值