机器学习：什么是监督学习和无监督学习

带带琪宝

已于 2024-01-25 11:18:28 修改

阅读量794

点赞数 8

分类专栏：机器学习文章标签：机器学习人工智能

于 2024-01-19 17:00:59 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_73716246/article/details/133931932

版权

机器学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

目录

一、监督学习

（一）回归

（二）分类

二、无监督学习

一、监督学习

介绍：监督学习是指学习输入到输出（x->y）映射的机器学习算法，监督即理解为：已知正确答案对其学习结果进行监督

原理：提供算法示例以供学习，通过查看 x->y 的正确示例，使得算法最终达到给定输入值 x 可以获得对于输出值 y 的合理预测或猜测结果

例子：监督学习主要包括分类问题和回归问题，如一个判断邮件是否为垃圾邮件、广告公司根据客户数据判断是否会点击广告、根据房子的面积拟合合适的线条预测房价，等等。

（一）回归

如下图是一个监督学习的特殊例子——回归，给定了算法一个数据集，其中对于每个面积 x，都有一个“正确答案”——y 标签，学习算法将持续进行学习，从无数个可能的输入对象预测结果

未来探讨的问题在于，如何选择合适的直线或其他曲线对模型拟合

（二）分类

分类可分为二分类和多分类问题

二分类的例子：医生使用一个诊断工具，根据病人医疗记录数据判断肿瘤是否是恶性的还是良性的，从而检测一名病人是否患有乳腺癌

为了简便，假设可以通过肿瘤大小这一属性判断其性质，在过往数据集里，可能有各种各样大小的肿瘤，如下横轴代表肿瘤大小，标记代表两个值（O为良性，X为恶性），学习算法可以以此判断是否为恶性肿瘤

有可能会有多个输出类型，即多分类：

也可以有多个输入值来预测输出：如根据年龄和肿瘤大小两个属性判断是否恶性

基于这样的数据集，学习算法要做的是找到合适的边界区分恶性肿瘤和良性肿瘤

除此之外可能会有更多的属性进行协助判断并得出结果

分类与回归的最大区别：分类输出的是预测类别，离散、小而有限（如0,1,2，则不能是除了这三类外的任意结果），而回归会从无限个可能的输入，预测输出数值，输出的是实数集

二、无监督学习

聚类

监督学习中，每个示例 x 与输出标签 y 相关联（x->y），而在无监督学习中，数据并未和任意输出标签相关，我们也没有对输入值指定一个所谓的“正确答案”，而是，在数据集中发现其本身特有的结构或模式。

如在上述肿瘤检测的问题中，我们并未给定所谓“良性”或“恶性”的标签，而由聚类算法（无监督学习的一种）根据数据集的特征，自行决定如何把并未标记的数据集划分为不同集群

如对于一个“某一些人为什么想学习AI”这个问题，聚类算法会根据客户信息的数据库，在没有标签的情况下自动将客户划分为某些类别，这个过程并不需要人为干预，这种即为无监督学习

关注

8
点赞
踩
10

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

带带琪宝 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。