机器学习笔记(九):聚类

有学者按照机器学习发生场景的不同,将机器学习划分为三种范式,它们分别是有监督学习、无监督学习与强化学习。有监督学习指的是用来训练模型的数据是带有标签的,训练过程可简单概括为根据“数据带有的标签”与“模型产生的输出”之间的误差来调整模型的参数。无监督学习则适用于无标签的数据集,它往往通过对训练集进行记忆,尝试查找出数据中隐含的规律,比如,根据数据的相似度对它们进行划分。强化学习同样是针对无标签的数据...
摘要由CSDN通过智能技术生成

有学者按照机器学习发生场景的不同,将机器学习划分为三种范式,它们分别是有监督学习、无监督学习与强化学习。有监督学习指的是用来训练模型的数据是带有标签的,训练过程可简单概括为根据“数据带有的标签”与“模型产生的输出”之间的误差来调整模型的参数。无监督学习则适用于无标签的数据集,它往往通过对训练集进行记忆,尝试查找出数据中隐含的规律,比如,根据数据的相似度对它们进行划分。强化学习同样是针对无标签的数据集,但在强化我们会有一个reward函数,来判断我们的动作是否合理。本系列文章的二到七篇着重介绍了有一些有监督学习的算法,上一篇中也对强化学习进行了简单的概括,本篇文章将介绍最为常见的无监督学习算法—聚类。

目录

  • 什么是聚类?
  • 一些常见的聚类算法

 

 

 

一、什么是聚类

“聚类”一词最早应该出自《战国策》中的“方以类聚,物以群分”,这句话的意思是“同类的东西常聚在一起,志同道合的人相聚成群,反之就分开”。将这句话中所发现的规律应用到我们的机器学习中对无标签的数据进行处理,也即假设相似度高的输入数据往往属于同一类别,便是“聚类”的核心思想。

形式化地说,假定样本集包含m个无标记样本,每个样本是一个n维特征向量,则聚类算法将样本集D划分为k个不相交的簇

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值