基本聚类方法概述

1:划分方法:只有一层,把n个对象的集合划分为k个分区,k<=n

k-均值 和 k-中心点算法,这些属于启发式聚类方法,适合于发现中小型的数据库中的球状互斥簇

2:层次方法:将数据库划分并分层

分为 凝聚 和分裂方法:

凝聚:把一个对象当成一个组,与最相近的那个对象组合成一个簇,之后迭代,直到所有的对象在一个簇里面或者达到停止条件而停止。因此也被称为自底向上的方法

分裂:把所有的对象放在一个簇里面,每次迭代之后,一个簇被分裂成几个小簇,直到每个对象一个簇为止或者簇内的对象彼此度充分相似。因此也被称为 自顶向下的方法

层次方法的缺陷:一旦一个步骤(凝聚或分裂)完成,就不能够撤销

3:基于密度的方法:

只要邻域中的点的密度(点的数目)超过某一个阀值,就继续增长给定的簇,这样的方法可以产生任意形状的簇。并且可以过滤噪声或离群点

4:基于网格的方法:

把对象空间量化为有限个单元形成一个网格结构。此方法可以与其他方法进行集成,处理速度快,独立于数据,但是依赖于网格大小

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值