应用机器学习 Applied Machine Learning (AML) ppt2

qq_58278472

于 2022-09-24 22:00:02 发布

阅读量743

点赞数 2

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_58278472/article/details/127031647

版权

分类 classification

在目前的机器学习工作中，最常见的三种任务就是：

回归分析
分类分析
聚类分析

什么是「分类」

虽然我们人类都不喜欢被分类，被贴标签，但数据研究的基础正是给数据“贴标签”进行分类。类别分得越精准，我们得到的结果就越有价值。

分类是一个有监督的学习过程，目标数据库中有哪些类别是已知的，分类过程需要做的就是把每一条记录归到对应的类别之中。由于必须事先知道各个类别的信息，并且所有待分类的数据条目都默认有对应的类别。

分类分为两种：

二元分类：当我们必须将给定数据分类为 2 个不同的类时。示例——根据一个人的特定健康状况，我们必须确定该人是否患有某种疾病。
多类分类：类的数量超过2。例如——根据不同种类的花的数据，我们必须确定我们的观察属于哪个种类。

区分「聚类」与「分类」

分类的目的是为了确定一个点的类别，具体有哪些类别是已知的，常用的算法是 KNN (k-nearest neighbors algorithm)，是一种有监督学习。聚类的目的是将一系列点分成若干类，事先是没有类别的，常用的算法是 K-Means 算法，是一种无监督学习。

两者也有共同点，那就是它们都包含这样一个过程：对于想要分析的目标点，都会在数据集中寻找离它最近的点，即二者都用到了 NN (Nears Neighbor) 算法。

一维分类问题 1D Classifcation Problem

本例子中一共有8条数据，每条数据格式（花瓣长度，类别）。不难看出第一类花花瓣都小于4cm，第二类花花瓣都大于4cm。机器学习模型也会学到这个特征，进行预测。

对于连续的特征，一个明

最低0.47元/天解锁文章

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
应用机器学习 Applied Machine Learning (AML) ppt2

机器学习贝叶斯高斯分布
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。