子空间聚类算法之PROCLUS

PROCLUS是一种1999年由Aggarwal等人提出的子空间聚类算法,基于投影,采用自顶向下的搜索策略。它包括初始阶段、迭代阶段和优化阶段,适合处理球形簇数据集,利用曼哈顿距离进行相似性度量。在初始阶段,随机选择中心点超集;在迭代阶段,确定最优中心点集;在优化阶段,优化中心点维度以提升聚类质量。
摘要由CSDN通过智能技术生成

PROCLUS算法

PROCLUS是由Aggarwal等人在1999年提出的一种子空间聚类算法。原文是《Fast Algorithms for Projected Clustering》,在ACM数据库可以进行下载。

算法总体介绍

PROCLUS是基于投影的子空间聚类算法,搜索策略为自顶向下。算法基于中心点思想,适合球形簇数据集,采用曼哈顿距离度量对象的相似性。

算法一共分为以下三个阶段:

  1. 初始阶段 ,选择中心点超集;
  2. 迭代阶段,确定每一个中心点的特征维度,通过对聚类结果进行分析,并不断迭代替换差的中心点,得到最优中心点集;
  3. 优化阶段,对中心点维度进行优化,改善聚类质量;

初始阶段

输入:数据集合 D D D,簇个数 K K K,常数 A A A,常数 B B B
输出:中心点集 M C MC MC

  1. 从数据集中随机选择 A ∗ K A*K AK A A A是常数)个数据构成初始中心点超集 M C ′ MC' MC
  2. 使用贪心算法从 M C ′ MC&#x27; MC中选择大小为 B ∗ K B*K BK B B B为常数,且 B &lt; A B&lt;A B<A)的中心点集 M C MC MC
    2.1 初始化 M C MC MC为空集
    2.2 从 M C ′ MC&#x27; MC中随机选择一个样本 m m m加入 M C MC MC(同时将 m m m M C ’ MC’ MC中移除)
    2.3 计算 M C ′ MC&#x27; MC中每个点与 M C MC
  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值