机器学习（Machine learning，ML）学习笔记（区分监督学习与半监督学习）

最新推荐文章于 2023-05-21 20:34:02 发布

czmjy

最新推荐文章于 2023-05-21 20:34:02 发布

阅读量856

点赞数

文章标签：学习

本文链接：https://blog.csdn.net/czmjy/article/details/124426142

版权

1机器学习分类

根据训练样本和反馈方式的不同，机器学习分为监督学习、无监督学习、半监督学习、深度学习、强化学习和迁移学习六类。

1.1.监督学习（Supervised learning，SL）：提供人为标注的监督信号

1.2.无监督学习(Unsupervised learning，UL)：是指从无标注数据中学习预测模型的机器学习方法，其本质是学习数据中的统计规律或潜在结构。无监督学习方法：聚类、K均值、PCA等

1.2.1自监督学习（Self-supervised Learning）：是指直接从大规模的无监督数据中挖掘自身监督信息来进行监督学习和训练的一种机器学习方法（可以看成是无监督学习的一种特殊情况。PS：也有人看成是有监督学习的一种特殊情况），自监督学习需要标签，不过这个标签不来自于人工标注，而是来自于数据本身。自监督的监督信号来源于数据本身的内容，也就是自己给自己监督信号(self的含义)。也可以认为是实例级别的标注，每个样本是一个类。自监督学习方法：基于上下文、基于时序、基于对比等。

1.3.半监督学习(Semi-Supervised Learning,SSL) ：用少量标记的大量未标记的数据啦执行有监督或无监督的学习任务。

1.4. 深度学习（Deep learning，DL）：训练样本是有标签的，试图使用复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象

1.5. 强化学习 (Reinforcement learning，RL) ：训练和 UL同样都是使用未标记的训练集，其核心是描述并解决智能体在与环境交互的过程中学习策略以最大化回报或实现特定目标的问题。

SL或 UL主要应用的是统计学，RL则更多地使用了随机过程、离散数学等方法。常见的RL代表算法：Q-学习算法、瞬时差分法、自适应启发评价算法等。

1.6. 迁移学习（Transfer Learning，TL）：根据任务间的相似性，将在辅助领域之前所学的知识用于相似却不相同的目标领域中来进行学习，有效地提高新任务的学习效率。迁移学习可分为基于样本、基于参数、基于特征表示和基于关系知识的四类迁移方式。

1.7.各学习方法之间的联系

SL、SSL和 UL是传统 ML 方法；DL提供了一个更强大的预测模型，可产生良好的预测结果；RL提供了更快的学习机制，且更适应环境的变化；TL突破了任务的限制，将 TL应用于 RL中，能帮助 RL更好地落实到实际问题。 RL的训练通常在自有规则的虚拟环境中进行，现实中要复杂得多；神经网络的训练太费时，所需数据集不统一。因此，用TL将已经训练好的模型运用于其他任务上变得越来越重要。