聚类分析----准则函数

判别分类结果好坏的一般标准:类内距离小,类间距离大。

类内的准则函数

设有待分类的模式集   在某种相似性测度基础上被划分为C类,

类内距离准则函数J_W定义为:(\vec{m}_j表示\omega _j类的模式均值矢量。)

m_j=\frac{1}{n_j}\sum_{i=1}^{n_j}x_{i}^{(j)} (j=1,2,...,c)

我们的目标是令J_W取最小,这种准则也称为误差平方和准则。

显然,J_W在样本集{{x_i}}和类数给定的条件下,J_W的值取决于模式类别的分划与类心的选取。

还可以视情况使用加权类内距离准则

类间距离准则

J_B=\sum_{j=1}^{c}(m_j-m)^T(m_j-m)\Rightarrow max

式中:m_j\omega _j类的模式平均矢量,m为总的模式平均矢量。

n_j\omega _j所含模式个数,则

                  m_j=\frac{1}{n_j}\sum_{x_i\in \omega j}x_i

                m=\frac{1}{N}\sum_{i=1}^{N}x_i

加权类间距离准则

基于类内距离类间距离的准则函数

设带分类模式集{xi,i=1,2,...,N},将它们分成c类,其中Wj类含nj个模式,分类后各模式记为\{x_i^{(j)},j=1,2,...,c;i=1,2,...,n_j\}

\omega _j的类内差阵定义为

式中:mj为wj类的模式均值矢量

总的类内离差阵定义为

类间离差阵定义为

S_B=\sum_{j=1}^{c}\frac{n_j}{N}(m_j-m)(m_j-m)^T

式中:m为所有待分类模式的均值矢量

m=\frac{1}{N}\sum_{i=1}^{N}x_i

总的离差阵S_T定义为

S_T=S_W+S_B

聚类的基本目的是使或   。利用线形代数有关矩阵的迹和行列式的性质,可以定义如下4个聚类的准则函数:

由它们的构造可以看出,为得到好的聚类结果,应该使它们尽量的大。

  • 10
    点赞
  • 34
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值