机器学习类型概述

姜萌芽

已于 2022-05-21 15:48:49 修改

阅读量1.1w

点赞数 6

分类专栏：机器学习文章标签：机器学习算法

于 2022-05-21 15:44:54 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jiangmengya1/article/details/124899029

版权

机器学习专栏收录该内容

7 篇文章 0 订阅

订阅专栏

从不同的视角来看待诸多机器学习算法，有不同的划分。

1、语料视角

根据训练语料对人工参与类别划分或标签标识的需求程度，可将机器学习划分为四种类型: 监督学习、无监督学习、半监督学习、强化学习。

1.1、监督学习 Supervised Learning

在监督学习算法中，提供给算法用于模型训练的数据，其实例的类别或标签是需要人工进行标注的，也即监督二词之所谓。

监督学习算法主要分为两类：分类、回归。

分类算法通常用于执行分类操作。比如，给一邮件，模型判断该邮件是否是垃圾邮件。

回归算法通常根据数据实例的各种属性值，去预测一个目标数值。比如，给出一辆二手车的一些属性值，比如车龄、里程数、品牌、型号等，模型预测出该二手车所对应的估值交易价格。

常见的监督学习算法如下：

1.2、无监督学习 Unsupervised Learning

在无监督算法中，不需要对训练数据进行类别或标签的标注。

无监督学习主要分为四类：聚类算法、异常点检测算法、可视化及降维算法、关联算法。

聚类算法主要用于对数据实例进行聚合分组。例如，聚类算法可以让我们对网购的消费者进行分类，而不需要人工为算法提供消费者的预定义类型数目。

异常点检测算法主要应用于对异常实例的检测发现。例如，挖掘交易事务流中的异常交易。

可视化及降维算法应用于高维数据的可视化展示、降维优化。例如，我们对二手车价格进行评估时候，其车龄和里程通常是高度正相关的，通过降维算法就可以将这两个特征进行合并，以简化问题的复杂性。特别是当处理大量数据时候，降维算法可以有效节约内存空间、存储空间、计算时间等。

关联算法应用于挖掘实例数据不同属性之间的关联关系。例如，针对网购消费者，通过关联算法可以发现，买了羊蹄和羊肉串的顾客，通常也会买些孜然粉。

1.3、半监督学习 Semisupervised Learning

半监督学习，介于监督学习和无监督学习之间，需要对训练数据的类别和标签，进行部分标注。很多半监督学习是监督学习和无监督学习的组合。

1.4、强化学习 Reinforcement Learning

强化学习，主要基于 “ 行动 + 赏罚 ” 机制。例如走路机器人、DeepMind 的 AlphaGo 等。同上述三种学习机制相比，强化学习是一个明显的另类，单独自居。

2、训练视角

根据算法是否可以从数据流中进行增量学习，可以将机器学习算法分为批量学习算法、在线学习算法。

2.1、批量学习 Batch Learning

批量学习不支持增量学习。也就是说，如果要进行模型的版本更新，需要将原有训练语料、增量训练语料放在一起，重新训练得一新的模型，来替换旧模型。

比如，批量学习就像铸造铜像一样，现在已有一个较小的铜像，现在想得到一个较大的铜像（版本更新），就需要将较小的铜像、新的铜料，放在一起进行熔化融合，得到一个较大的铜像。

2.2、在线学习 Online Learning

在线学习可以进行增量学习。

比如，在线学习有点像陈年卤煮的卤汁制作一样，经营的过程中，一批批被加入训练的语料类比于盐、胡椒、花椒、桂皮、八角，需要根据业务的需求，增量地加入新语料进行模型更新训练即可，每加入一批次语料，便是一次版本更新。

3、预测视角

根据模型预测是基于实例数据的直接对比，还是基于实例模式的抽象计算，可以将机器学习算法划分为基于实例学习、基于模型学习。

3.1、基于实例学习 Instance-based Learning

基于实例的学习，通过对比待预测数据、训练数据，两者的相似度，来把更类似于待预测数据的训练数据标签，赋予待预测数据。

比如，西二旗人大多背双肩电脑包，国贸人大多挎个公文包，现在来了一个新人，背双肩电脑包，我们直观地认为他是西二旗人。

3.2、基于模型学习 Model-based Learning

基于模型的学习，不直接对比训练数据、待预测数据。而是基于训练数据，构建一个抽象模型（包括模型选择、模型训练），然后根据该抽象模型的算法偏好，对待预测数据进行分类或标签的设定。

比如，有一堆被标注为狗狗的图片，有一堆被标注为猫猫的图片，现在来了一张新照片，我们不太容易硬编程不同动物之间的差别，也就是说，不太容易直接同已有照片进行硬编程对比。对此，我们通常设计一个简单的卷积神经网络，训练一个二分类模型，来对新照片来进行分类预测。

关注

6
点赞
踩
44

收藏

觉得还不错? 一键收藏
0
评论
机器学习类型概述

从不同的视角来看待诸多机器学习算法，有不同的划分。1、语料视角根据训练语料对人工参与类别划分或标签标识的需求程度，可将机器学习划分为四种类型: 监督学习、无监督学习、半监督学习、强化学习。1.1、监督学习 Supervised Learning在监督学习算法中，提供给算法用于模型训练的数据，其实例的类别或标签是需要人工进行标注的，也即监督二词之所谓。监督学习算法主要分为两类：分类、回归。分类算法通常用于执行分类操作。比如，给一邮件，模型判断该邮件是否是垃圾邮件。回归算法通
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。