聚类模型-密度聚类-DBSCAN

最新推荐文章于 2024-03-30 23:41:34 发布

myazi

最新推荐文章于 2024-03-30 23:41:34 发布

阅读量1.8k

点赞数 1

分类专栏：机器学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010865478/article/details/82716929

版权

聚类模型

1、层次聚类

2、原型聚类-K-means

3、模型聚类-GMM

4、EM算法-LDA主题模型

5、密度聚类-DBSCAN

6、图聚类-谱聚类

五、密度聚类-DBSCAN

DBSCAN的类表示是一簇密度可达的样本，相似性度量定义为密度可达，密度可达即为一类，属于硬划分。密度聚类是一种基于密度的聚类，其根据样本的空间分布关系进行聚类。一般来讲，用带参的模型来定义样本的分布可以看作是带参的密度估计，比如高斯混合模型，高斯判别分析；用无参的模型来描述样本的分布称为无参密度估计，比如直方图，核密度估计，山峰聚类，DBSCAN，meanshift。

假设我的样本集是 $(x_1,x_2,...,x_m)$ ，在DBSCAN中为了描述样本分布的关系，定义了如下几个概念：

1） $\epsilon$ -邻域：对于 $x_j\in D$ ，其 $\epsilon$ -邻域包含样本集 $D$ 中与 $x_j$ 的距离不大于 $\epsilon$ 的子样本集，即 $N_{\epsilon}(x_j) = \{x_i \in D | distance(x_i,x_j) \leq \epsilon\}$ 这个子样本集的个数记为 $|N \in (x_j)|$ 　

2）核心对象：对于任一样本 $x_j\in D$ ，如果其 $\epsilon$ -邻域对应的 N∈(x

最低0.47元/天解锁文章

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

myazi CSDN认证博客专家 CSDN认证企业博客

码龄11年

57: 原创

9万+: 周排名

93万+: 总排名

15万+: 访问

: 等级

2079: 积分

98: 粉丝

52: 获赞

25: 评论

352: 收藏

私信

关注

热门文章

分类专栏

最新评论

Linux内核源代码情景分析笔记
TIMANDDAY: 我不明白__pa(x)这个宏，他把虚拟地址转换成物理地址，但是，如果我的内存没有4G，比如只有1G，甚至是512mb，那这个宏算出来岂不是错了
动态规划乘法表问题
浙江省第一延迟: 已经想清楚了，谢谢铁子的帖子，太顶了
动态规划乘法表问题
浙江省第一延迟: if(i+k<len&&str[i+k]!='\0') j=i+k; else j=size; 这里的j为什么是=size啊，而不是size-1，我觉得=size-1才对，但测试发现是 =size是正确的
Linux内核源代码情景分析笔记
夜半读核: 这本书不太好读，特别是内存管理这一章，我草草读了一遍，正打算读第二遍呢！
NLP中文分词C++实现
weixin_45598354: 请问如何调试？小贝一枚求解答，谢谢

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。