机器学习笔记(九):聚类

有学者按照机器学习发生场景的不同,将机器学习划分为三种范式,它们分别是有监督学习、无监督学习与强化学习。有监督学习指的是用来训练模型的数据是带有标签的,训练过程可简单概括为根据“数据带有的标签”与“模型产生的输出”之间的误差来调整模型的参数。无监督学习则适用于无标签的数据集,它往往通过对训练集进行记忆,尝试查找出数据中隐含的规律,比如,根据数据的相似度对它们进行划分。强化学习同样是针对无标签的数据集,但在强化我们会有一个reward函数,来判断我们的动作是否合理。本系列文章的二到七篇着重介绍了有一些有监督学习的算法,上一篇中也对强化学习进行了简单的概括,本篇文章将介绍最为常见的无监督学习算法—聚类。

目录

  • 什么是聚类?
  • 一些常见的聚类算法

 

 

 

一、什么是聚类

“聚类”一词最早应该出自《战国策》中的“方以类聚,物以群分”,这句话的意思是“同类的东西常聚在一起,志同道合的人相聚成群,反之就分开”。将这句话中所发现的规律应用到我们的机器学习中对无标签的数据进行处理,也即假设相似度高的输入数据往往属于同一类别,便是“聚类”的核心思想。

形式化地说,假定样本集包含m个无标记样本&#x

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
机器学习是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。在过去的十年中,机器学习帮助我们自动驾驶汽车,有效的语音识别,有效的网络搜索,并极大地提高了人类基因组的认识。在本课中,将学习最有效的机器学习技术,并获得实践,让它们为自己的工作。更重要的是,不仅得到理论基础的学习,而且获得那些需要快速和强大的应用技术解决问题的实用技术。最后,会学到一些硅谷利用机器学习和人工智能的最佳实践创新。本课程提供了一个广泛的介绍机器学习、数据挖掘、统计模式识别的课程。主题包括: (一)监督学习(参数/非参数算法,支持向量机,核函数,神经网络)。 (二)无监督学习(聚类,降维,推荐系统,深入学习推荐)。 (三)在机器学习的最佳实践(偏差/方差理论;在机器学习和人工智能创新过程)。 本课程还将使用大量的案例研究,您还将学习如何运用学习算法构建智能机器人(感知,控制),文本的理解(Web 搜索,反垃圾邮件),计算机视觉,医疗信息,音频,数据挖掘,和其他领域。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值