无监督学习之聚类算法

本文深入探讨了无监督学习中的聚类算法,包括K-means的步骤、特点及其优化算法如K-Mediods和二分K-means。详细介绍了DBSCAN的密度相连概念和层次聚类的优势。同时,讨论了聚类评估方法如Rand Index和轮廓系数,以及聚类算法的选择和对比。
摘要由CSDN通过智能技术生成

一、概念

 将N个样本映射到K个簇中,每个簇至少有一个样本

二、聚类思路

先给定K个划分,迭代样本与簇的隶属关系,每次都比前一次好一些,
迭代若干次 就能得到比较好的结果

三、聚类用途

1、知识发现 发现事物之间的潜在关系
2、异常值检测
3、特征提取 数据压缩的例子

四、K-means

求距离和相似的 方法数据间的相似度求解方法_宠乖仪的博客-CSDN博客

1、K-means算法步骤

  1. 选择K个初始的簇中心

  2. 逐个计算每个样本到中心的距离, 将样本归属到距离最小的那个簇中心的簇中

  3. 每个簇内部计算平均值 更新簇中心

  4. 开始迭代

2、K-means的特点

  • 优点:

    • 简单,效果不错

  • 缺点​​​​​​

    • 对异常值敏感
    • 对初始值敏感
    • 对某些分布聚类效果不好

3、K-means算法的优化算法

3.1 K-Mediods

  •  计算新的簇中心的时候不再选择均值,而是选择中位数
  • 抗噪能力得到加强

3.2 二分K-means

  •  K-means的损失函
    • 每个点到中心点的位置 MSE
  • 分别计算四个簇的mse,会发现有两个簇的MSE很小,一个簇的MSE很大
  • 选择合并簇中心点比较近,MSE很小簇 切分簇中心离其他簇中心比较远,MSE比较大的簇,重新进行K-means聚类

3.3 K-means++

  • K-means选择一个好的初始中心点非常重要
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

allen wy

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值