文献阅读 An incremental density-based clustering framework using fuzzy local clustering

最新推荐文章于 2024-06-26 07:59:44 发布

uodgnez

最新推荐文章于 2024-06-26 07:59:44 发布

阅读量352

点赞数

分类专栏： paper 文章标签：聚类机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_48320163/article/details/121018036

版权

paper 专栏收录该内容

12 篇文章 0 订阅

订阅专栏

暑期任务, “补档”.

题目: An incremental density-based clustering framework using fuzzy local clustering

IDC（One-pass incremental density-based clustering）：

包括两个过程：局部聚类和最终聚类。

存在的缺陷：单独处理每一个数据点而不是考虑整个数据集, 对于流数据来说没什么关系因为流数据有特定的传入序列. 对于传统数据集, 它的最终簇是由整个数据组成的, 而不同的处理顺序可能会导致不一样的聚类结果; 对于复杂的数据集, IDC要求用户输入的用于区分噪声的单个阈值不能有效地应对不同分布的簇.

为了解决以上问题, 该论文基于IDC框架提出了FLDC (Fuzzy incremental density-based algorithm), 采用它的两步骤——微聚类 (局部聚类)、最终聚类; 利用FLCA实现微聚类, 利用MVSA实现最终聚类.

FLCA (Fuzzy local clustering algorithm)：

为了减少不同处理顺序的不一致性, 允许一个数据点可以属于多个局部簇. 这样产生的聚类结果在不同的处理顺序上会变得更加稳定.

MVSA (Modified valley seeking algorithm):

对于复杂的数据集, 它可以自动估计每个密度峰值的密度阈值; 并且所需的用户参数较少, 简化了参数构建过程.

优点: 与其他基于密度的聚类算法相比, 处理大型数据集所使用的时间少, 能更有效地处理不同密度的数据.

不足: 在处理小规模数据时, FIDC的计算速度不如DBSCAN等算法; 当处理的数据集较为分散时, FIDC可能就不会产生聚类结果; 对于高纬度的数据, 它也不能有效的进行处理.

源码测试 :

(ps: FIDC_traditional 代码不能正常运行)

1. KDD数据集

参数设置: rg=0.5; wnd_len = 10000; lambda = 0.2e-3

clst_pnt:

pf_mat: (列分别对应SIZE, NMI, AR, RI)

对上部分数据取平均:

2. NSL-KDD数据集

参数设置: rg=0.5; wnd_len = 10000; lambda = 0.2e-3

clst_pnt:

pf_mat:

平均:

3. Covertype

参数设置: rg = 0.4; wnd_len = 5000; lambda= 0.4e-3

clst_pnt:

pf_mat:

取平均:

通过测试, 其结果与论文所述基本吻合.

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
文献阅读 An incremental density-based clustering framework using fuzzy local clustering

暑期任务, “补档”.题目:An incremental density-based clustering framework using fuzzy local clusteringIDC（One-pass incremental density-based clustering）：包括两个过程：局部聚类和最终聚类。存在的缺陷：单独处理每一个数据点而不是考虑整个数据集, 对于流数据来说没什么关系因为流数据有特定的传入序列. 对于传统数据集, 它的最终簇是由整个数据组成的, 而不同的处理顺.
复制链接

扫一扫

专栏目录

uodgnez CSDN认证博客专家 CSDN认证企业博客

码龄4年

93: 原创

23万+: 周排名

8万+: 总排名

20万+: 访问

: 等级

1251: 积分

280: 粉丝

261: 获赞

38: 评论

921: 收藏

私信

关注

热门文章

分类专栏

python 9篇
其他 15篇
图像处理 18篇
LeetCode 11篇
paper 12篇
地震勘探 10篇
机器学习 14篇
神经网络 13篇
深度学习 26篇
java学习 4篇
离散数学 6篇

最新评论

行测小技巧
CSDN-Ada助手: 推荐算法技能树：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm
GAN的损失函数
m0_72700448: 一般的话鉴别器损失值大概在多少比较合适呢，求教
GAN的损失函数
穆姬姗: 我明白了您的意思是期望吧而不是损失
GAN的损失函数
uodgnez: 理想的判别器：D(x) ↑，log(D(x)) ↑，D(G(z))↓，log(1-D(D(G(X)))↑，总体是个递增函数，哥们，所以Loss_D应该是越大的
pytorch实现pix2pix模型的搭建
uodgnez: 我忘记了，应该是没有修改

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。