聚类基本数学模型

聚类方法是一类用途非常广泛的算法,聚类包含很多各式各样的算法。所有这些算法都有它的基本数学模型。本文就简单介绍一下聚类的基本数学模型。了解 了基本数学模型就了解了聚类最本质的原理。无论是学习算法还是自己开发新的算法,学习基本数学模型都是很有帮助的。本文的目的一方面是介绍数学模型,另一 方面也算是自己学习内容的一个记录吧。

  假设X={x1 ,x2 ,…,xn }是待分析的对象全体,也可称为论域或样本集合。X中的每个对象(也可称为样本) 常用有限个参数值来刻画(这里的参数值也可称为样本的属性值),每个参数值用于刻画xi 的某个特征(属性)。于是对象xi 就伴随着一个向量P(xi )=(xi1 ,xi2 ,…,xim ), 其中xij ()是xi 在j个特征上的值,P(xi )称为xi 的特征向量或模式向量(也可理解为用于定义聚类中心的向量,不过这样的理解并不严谨,因为并非每种聚类方法都是以类似于KMEANS那样的中心点来定义簇的,所以在数据模型中以P(xi )来表示在意义上更加抽象)。聚类分析就是分析论域或样本集合X中的n个样本所对应的模式矢量间的空间距离及分散情况,按照各样本间的距离远近或相似程度把x1 , x2 ,…, xn 划分成k个不相交的模式子集X1 , X2 , …, Xk ,并要求满足下列条件:

样本 对子集 的隶属度关系可用隶属度函数表示为:

 

 

其中,隶属度函数必须满足条件 。也就是说:

  1. 要求每一个样本能且只能隶属于某一类。
  2. 要求每个子类都是非空的。

  在这个表达式中 是用于约束"每一个样本能且只能属于某一类"; 用于约束"每个子类都是非空的"。将以上定义的隶属度函数wij 扩展到[0,1]这个区间即为模糊聚类的定义。模糊聚类又称为软聚类,相应的非模糊聚类也可称为硬聚类。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值