机器学习系列----准备知识(1)

机器学习已经很久没有复习了,这周开始准备复习一下机器学习的算法。主要参考了机器学习实战这本书,慢慢填坑吧!磨刀不误砍柴工,先补补准备知识。今天这篇博客主要介绍下,分类和聚类的区别

    分类( Classification)

    分类的目的是学会一个分类函数或分类模型(也常常称作分类器),该模型能把数据库中的数据项映射到给定类别中的某一个类中。它找出描述并区分数据类或概念的模型(或函数),以便能够使用模型预测类标记未知的对象类。

    聚类(Clustering)

    它的目的是使得属于同一个簇的样本之间应该彼此相似,而不同簇的样本应该足够不相似。是指根据“物以类聚”的原理,将本身没有类别的样本聚集成不同的组,这样的一组数据对象的集合叫做簇,并且对每一个这样的簇进行描述的过程。

    个人理解:最主要的区别是最后的训练结果。

    分类最后的结果是要得到一个分类器,分类器其实就是一个函数(或者叫模型),该函数的输入就是数据的特征值,对于新来的数据,我们只要将该数据的特征值输入进函数,就能得到一个输出,也就是预测的该数据属于的类别。

    聚类的最后结果是得到各个类簇(或者类的集合)。与分类规则不同,进行聚类前并不知道将要划分成几个组和什么样的组,也不知道根据哪些空间区分规则来定义组。其目的旨在发现空间实体的属性间的函数关系,挖掘的知识用以属性名为变量的数学方程来表示。比如下一节的KNN算法,就是一个典型的聚类算法。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值