模式识别——聚类分析 学习笔记

聚类分析相关概念

聚类分析——对一批没有标出类别的模式样本集,按照样本之间的相似程度分类,相似的归为一类,不相似的归为另一类
聚类中,将样本根据相似程度进行分类,这个相似程度就是用样本特征之间的相似程度。把整个模式样本集的特征向量看成是分布在特征空间中的一些点,点与点之间的距离即可作为模式相似性的测量依据,也就是将特征空间中距离较近的样本归为一类。
其中,特征的选择非常重要。当特征选少了,可能导致聚类困难;特征选多了,就会增加计算量。

模式相似性的测度和聚类准则

相似性测度

为了能将模式集划分成不同的类别,必须定义一种相似性的测度,来度量同一类样本间的类似性和不属于同一类样本间的差异性。
相似性测度一般有欧氏距离、马氏距离、明氏距离等。
其中,用作测度的各种距离的量纲的选择要保持一致,否则,选择不同的量纲会导致不同的分类,如下图。
这里写图片描述

聚类准则

有了模式的相似性测度,还需要一种基于数值的聚类准则,能将相似的模式样本分在同一类,相异的模式样本分在不同的类。聚类准则一般有试探方法和聚类准则函数法。

聚类算法举例

KNN最近邻算法

该算法的步骤如下:
Nx1,x2,,xNTz1,z2,
第一步——
xiz1=x1
D21=||x2z1||
D21>Tz2=x2
x2z1
第二步——
z1z2
D31=||x3z1||
D32=||x3z2||
D31>TD32>Tz3=x3
x3z1z2

N

K均值算法

第一步——
Kz1(1)z2(1)zK(1)K
第二步——
xKzj(1)
i=jDj(k)=min{||xzi(k)||,i=1,2,...,k},xSi(k),kk=1Sjjzj
第三步——
zj(k+1)j=1,2,,K

zj(k+1)=1NxSj(k)x,j=1,2,...,K
KK
第四步——
zj(k+1)zj(k)j=1,2,,Kzj(k+1)=zj(k)j=1,2,,K
<script type="math/tex; mode=display" id="MathJax-Element-137"></script>
*本人才疏学浅,文中若有不当之处,望请指点

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值