机器学习算法(9)之聚类算法

本文深入探讨了聚类分析,包括聚类的定义、目标及常见的聚类算法如K-means和DBSCAN。K-means中详细阐述了距离度量方式、算法原理、参数设置及其优化策略,如K-Means++和Mini Batch K-Means。DBSCAN作为一种密度聚类算法,其基于密度的聚类原理和参数调整也进行了讲解。文章适合对机器学习和聚类算法感兴趣的读者。
摘要由CSDN通过智能技术生成

前言:在谈论K-means之前,我们是不是会联想到KNN算法呢,感觉这两个好像啊,其实两者差别还是很大的,一个是有监督学习算法,有对应的类别输出,一个是无监督的学习算法,没有样本输出,而且KNN算法是基于实例的一种的算法,KNN只是简单地把训练样例存储起来,并没有中间的训练过程,而K-mans算法确是有算法的训练过程

当然,两者也有一些相似点,两个算法都蕴含着要找出某一个点和另一个点最近的点,两者都利用了最近邻的思想。


1、什么是聚类分析?

1.1 聚类的定义:

       聚类就是对大量未知标注的数据集,按数据的内在相似性将数据集划分为多个类别,使类别内的数据相似度较大,而类别间的数据相似度较小

  1. 聚类:一种把相似的数据合并成一组(group)的方法。就是我们常说的“人以群分,物以类聚”
  2. 聚类是一种“非监督的学习算法”——事先并不需要有类别标注的样本来辅助学习,而是直接从数据中学习模式
  3. 所以,聚类是一种“数据探索”的分析方法:它帮助我们在大量的数据中探索和发现数据的结构

1.2 聚类的目标   

  • 2
    点赞
  • 38
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

且行且安~

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值