机器学习笔记之监督学习

王青宇

已于 2022-03-18 16:34:48 修改

阅读量775

点赞数

文章标签：机器学习学习深度学习

于 2022-03-18 16:32:37 首次发布

本文链接：https://blog.csdn.net/Luisazong/article/details/123576734

版权

机器学习过程可通俗表达为：假定我们收集了一批关于西瓜的数据，（色泽=青绿；根蒂=蜷缩；敲声=清脆）（色泽=乌黑；根蒂=微蜷；敲声=沉闷）......每条描述对应的是一个好瓜或是坏瓜，我们通过这批数据学习经验，学到什么样表现的是好瓜，然后去判断一个新出现的瓜是好是坏。

（色泽=青绿；根蒂=蜷缩；敲声=清脆）（色泽=乌黑；根蒂=微蜷；敲声=沉闷）......这一批记录的集合称为一个数据集，每条记录是关于一个西瓜（事件/对象）的描述，称为示例/样本。从数据中学得模型的过程即称为学习/训练。我们希望通过数据集收获经验，学到什么样表现的是好瓜，然后去判断一个新出现的瓜是好是坏，获得一种泛化能力（学得模型适用于新样本的能力）。

机器学习按照学习方式的不同可分为：监督学习、无监督学习、半监督学习与强化学习。

监督学习：亦称“有导师学习”，简单来说就是存在一组输入输出数据集，可以通过这组数据集训练出模型，再通过训练得到的模型将输入数据映射为相应的输出达到对未知数据进行分类的能力。使用的训练样本有标签。就是有老师教，有例子可以学，有迹可循。回归是其代表。就是我们有了一批西瓜数据，可以学习通过这批数据学习到判断瓜好坏的能力。

无监督学习：简单来说就是一切靠自己，事先没有任何训练样本，需要直接对数据进行建模。使用的训练样本无标签。听起来没有道理，但是现实世界中有时就是事先没有数据，需要这样去学习，比如我们自身认识世界的过程中很多处都用到了无监督学习。比如我们去参观一个画展，我们完全对艺术一无所知，但是欣赏完多幅作品之后，我们也能把它们分成不同的派别（比如哪些更朦胧一点，哪些更写实一些，即使我们不知道什么叫做朦胧派，什么叫做写实派，但是至少我们能把他们分为两个类）。就是我们没有西瓜数据，只能通过“浅色瓜”、“深色瓜”，“本地瓜”、“外地瓜”这些潜在的概念去划分出好瓜坏瓜。这样的学习方式将数据通过一些潜在的概念划分，有时有助于我们了解数据内在的规律。聚类是其代表。

半监督学习：在少量样本标签的引导下，能够充分利用大量无标签样本提高学习性能，避免了数据资源的浪费，同时解决了有标签样本较少时监督学习方法泛化能力不强和缺少样本标签引导时无监督学习方法不准确的问题。

强化学习：强化学习会在没有任何标签的情况下，通过先尝试做出一些行为得到一个结果，通过这个结果是对还是错的反馈，调整之前的行为，就这样不断的调整，算法能够学习到在什么样的情况下选择什么样的行为可以得到最好的结果。

强化学习与监督学习的对比可参考文章：一文了解强化学习_Alice熹爱学习的博客-CSDN博客_强化学习

本文西瓜的例子参考周志华的“西瓜书”《机器学习》

其他详细可参考：我的机器学习笔记(一) - 监督学习vs 无监督学习 - 简书

王青宇

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习笔记之监督学习

机器学习过程可通俗表达为：假定我们收集了一批关于西瓜的数据，（色泽=青绿；根蒂=蜷缩；敲声=清脆）（色泽=乌黑；根蒂=微蜷；敲声=沉闷）......每条描述对应的是一个好瓜或是坏瓜，我们通过这批数据学习经验，学到什么样表现的是好瓜，然后去判断一个新出现的瓜是好是坏。（色泽=青绿；根蒂=蜷缩；敲声=清脆）（色泽=乌黑；根蒂=微蜷；敲声=沉闷）......这一批记录的集合称为一个数据集，每条记录是关于一个西瓜（事件/对象）的描述，称为示例/样本。从数据中学得模型的过程即称为学习/训练。我们希望通过数据集收获
复制链接

扫一扫