数据挖掘学习——聚类分析(k-均值聚类、DBSCAN、AGNES)、python代码

长弓同学

已于 2022-09-25 20:08:46 修改

阅读量5k

点赞数 6

文章标签：数据挖掘学习聚类

于 2022-09-25 20:05:04 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_52135595/article/details/127037847

版权

目录

（1）聚类问题的定义

（2）聚类的依据（距离的定义）

3.基于原型的聚类方法（k-均值聚类）

（1）k-均值聚类的基本思想和基本步骤

（2）k-均值聚类的特点

4.基于密度的聚类方法DBSCAN

5.基于层次的聚类方法（AGNES聚类方法）

（1）k-均值聚类

1.概论

之前几类数据挖掘的目的是挖掘出样本数据与标签之间的关系，因此这种学习模型被称为监督学习。

而聚类分析则是另一种学习模式，它处理的数据没有标签，因此也称之为无监督学习方法。

聚类分析是指根据数据内部的相互关系将数据样本划分为不同的集合。

2.聚类问题

（1）聚类问题的定义

聚类分析的结果是将相似的样本划分在同一个簇中，差别较大的样本划分到不同的簇。

（2）聚类的依据（距离的定义）

对样本进行聚类的依据是样本之间的相似度，样本之间的相似度通常使用样本距离来衡量。

使用不同的距离定义对聚类结果有很大影响。常见的距离定义有：

1.闵可夫斯基距离

2.曼哈顿距离

3.欧几里得距离

4.加权闵可夫斯基距离

5.余弦距离

3.基于原型的聚类方法（k-均值聚类）

常见的聚类方法主要有三种：基于原型的聚类方法、基于密度的聚类方法和基于层次的聚类方法

基于原型的聚类方法：所谓原型一般是指簇的中心点，簇中所有的样本都与这个中心点具有相似的特征。

k-均值聚类：k-均值聚类是一种典型的基于原型的聚类方法，它假设所有的样本可以划分为k个簇，每个样本属于当中的某个簇。

最低0.47元/天解锁文章

关注

6
点赞
踩
73

收藏

觉得还不错? 一键收藏
1
评论
数据挖掘学习——聚类分析(k-均值聚类、DBSCAN、AGNES)、python代码

聚类分析的结果是将相似的样本划分在同一个簇中，差别较大的样本划分到不同的簇。对样本进行聚类的依据是样本之间的相似度，样本之间的相似度通常使用样本距离来衡量。使用不同的距离定义对聚类结果有很大影响。1.闵可夫斯基距离2.曼哈顿距离3.欧几里得距离4.加权闵可夫斯基距离5.余弦距离。
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。