机器学习小问题 之 分类与聚类有什么区别?

本文探讨了机器学习中的聚类与分类问题。聚类是将对象按相似性分为多个类别的无监督学习方法,包括Q型和R型聚类,常见方法有层次聚类和K-means等。分类则是基于已知类别标签的样本进行学习,属于有监督学习。两者的本质区别在于,聚类分析不需要预先知道类别,而分类则需要有标签的训练数据。
摘要由CSDN通过智能技术生成

机器学习中的大部分问题都可以归为聚类或者分类问题。例如,我们利用神经网络来进行手写体数字识别,无非是将所有手写体数字图片分为标签为0,1,2,...,9这10个类别。

当我们分别来谈论聚类和分类问题时,我们对这两个概念都不陌生。但是,当我们将两者放在一起来谈时,我们可能又会发现,我们对二者的界限是很模糊的,仿佛二者说的是同一件事情。

所以,接下来我们就来梳理一下二者到底有什么区别。


目录

聚类 Clustering

简介

聚类分析的分类  

聚类分析的过程 

 常用聚类方法

分类

聚类与分类的区别 

参考链接 


聚类 Clustering

定义:将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类

简介

聚类,也被称作聚类分析,是一种重要的机器学习方法。聚类分析一般分为Q型聚类R型聚类。聚类的过程一般是先根据聚类对象及实际数据特点选择合适的统计量,然后利用这个统计量对数据或变量进行聚类。下面稍作详细介绍。

聚类分析的分类  

Q型聚类分析: 对样本进行聚类分析的聚类过程称为Q型聚类分析。

R型聚类分析:  对指标变量进行聚类分析的聚类过程称为R型聚类分析。

聚类分析的过程 

 

 

数据预处理:是一个将数据标准化的过程,避免不同变量的量纲不同导致相似性度量的差异。

构造关系矩阵:是为了度量变量(或者样本)质量的亲疏关系 。

聚类:利用这个关系矩阵,利用不同的聚类方法进行聚类。

确定最佳分类:最后根据聚类的表现,选择最佳聚类方法和最佳类比数目。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值