模式识别:聚类分析

1. 聚类分析中距离函数的有效性

    聚类分析采用距离函数作为相似性测量的依据,此种方法是否有效,取决于特征向量的分布。如果向量点是一群一群出现的,同一群样本密集,不同群样远离,则方法有效。如果所有样本的向量分布成一团,那么就很难做聚类分析。

 

2. 聚类分析中的特征选取

    做聚类分析时,选取的特征向量是否合适非常关键。例如许多不同品牌的酱油和可乐混杂放在一起,要将酱油和可乐分开来。如果以“味道”作为识别分类的特征,很容易就大道目的。如果以“颜色”作为识别分类的特征,那么就很难分别。

 

3. 相似性测度,距离是一种相似性的测度

(1)欧式(Euclid)距离:距离越小,越相似

          D(X1, X2) = ||X1-X2||,应该注意物理量的单位,同样物理意义的量要使用同样的单位,以免单位不统一造成不同分类结果。一般使用特征数据标准化的方法,使得特征与单位无关,此时描述的是一种相对的位置关系,只要相对位置关系不变,就不会影响分类。(特征数据标准化方法是怎样的?)

 

(2)马氏(Maharanobis)距离:距离越小,越相似

          D = [(X-M)^T] * [C^(-1)] * [(X-M],其中X为向量,M为某类模式的均值向量࿰

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值