denclue 聚类_DENCLUE:基于密度分布函数的聚类

DENCLUE:基于密度分布函数的聚类

1.DENCLUE是一种基于一组密度分布函数的聚类算法。

首先说一下密度估计的概念:密度估计就是根据一系列观测数据集来估计不可观测的概率密度函数。在基于密度聚类的背景下,不可观测的概率密度函数是待分析的所有可能的对象的总体的真实分布。观测数据集被看做取自该总体的几个随机样本。

不好理解?好,那就通俗的说一下:比如说要找一个女朋友,你不了解她,但是可以先了解她的好朋友,通过她的好朋友来推测她的人品如何。支付宝的芝麻评分也把每个人的好友的信用情况作为指标来评价每个人的信用情况。

2. DENCLUE算法的主要原理是:

(1) 每个数据点的影响可以用一个数学函数来形式化的模拟,它描述了数据点在邻域的影响,被称为影响函数。

(2) 数据空间的整体密度(全局密度函数)可以被模拟为所有数据点的影响函数总和。

(3) 聚类可以通过密度吸引点得到,这里的密度吸引点是全局密度函数的局部最大值。

(4) 使用一个步进式爬山过程,把待分析的数据分配到密度吸引点X*所代表的簇中。

爬山法是深度优先搜索的改进算法。在这种方法中,使用某种贪心算法来帮助我们决定在搜索空间中向哪个方向搜索。由于爬山法总是选择往局部最优的方向搜索,所以可能会有“无解”的风险,而且找到的接不一定是最优解。但是他比深度优先搜索的效率要高很多。爬山算法模型图可以由下图轻松理解。如果感兴趣的话,可以详细了解优化算法,爬山算法,蚁群算法,模拟退火算法。

3. DENCLUE算法步骤

DENCLUE算法步骤:输入:数据

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值