监督、半监督、无监督学习和深度、强化和迁移学习-CSDN博客

本文链接：https://blog.csdn.net/weixin_38952721/article/details/98877419

本文全面解析了机器学习的各类学习方式，包括监督、半监督、无监督学习的基础概念及应用场景，深度探讨了深度学习、强化学习与迁移学习的原理与局限，为读者提供了一个机器学习领域的宏观视角。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、监督、半监督、无监督学习

1.1、监督学习（Supervised learning）

监督学习是指：利用一组已知类别的样本调整分类器的参数，使其达到所要求性能的过程。

在监督学习中训练数据既有特征（feature）又有标签（label），通过训练，机器可以通过给定数据，预测标签。
监督学习的分类：回归（Regression）和分类（Classification）；
回归问题是针对于连续型变量的，例如预测房屋价格；
分类是针对离散型数据的，输出结果是有限的，比如判断好瓜坏瓜。

1.2、半监督学习（Semi-Supervised learning）

半监督学习是监督学习和无监督学习相结合的一种学习方法，它使用大量的未标记数据，以及同时使用标记数据，来进行模式识别工作。

当使用半监督学习时，将会要求尽量少的人员来从事工作，同时，又能够带来比较高的准确性。

主动学习的模型如下：
A=(C,Q,S,L,U)
其中C指的是一个或者多个分类器，Q指的是一些查询函数，也就是一些查询算法，S指的是监督者，通常指的是专家，L是少量标记的样本，U指的是大量未被标记的样本。
学习者利用少量标记样本L，通过机器学习算法学习一个或者多个机器学习模型C，然后通过查询算法，查询出一批最有用的样本，交给专家，让专家进行标记，最后将新学到的标记数据加入到少量样本中，继续训练模型。一直循环，直到达到一个准则为止。

参考https://blog.csdn.net/yuanlong_great/article/details/79644620

1.3、无监督学习（Unsupervised Learning）

根据类别未知（没有被标记）的训练样本解决模式识别中的各种问题，称为无监督学习。

（1）缺乏足够的先验知识，因此难以人工标注类别；
（2）进行人工类别标注的成本太高

数据只有特征，没有标签。
给定数据，让机器寻找隐藏的结构，换句话说就是直接对数据集建模。
无监督学习解决的主要是聚类（Clustering）问题，代表算法：
（1）K均值（K-Means）算法;
（2）自编码器（Auto-Encoder）;
（3）主成分分析（Principle Component Analysis）。

参考1 https://www.aiyingli.com/59488.html
参考2 https://blog.csdn.net/YUANLONG_GREAT/article/details/79644620

二、深度、强化和迁移学习

原文链接 https://blog.csdn.net/jiandanjinxin/article/details/54133521

2.1、深度学习（Deep Learning,DL）

基于卷积神经网络的深度学习（包括CNN,RNN），主要解决的领域是图像、文本、语音，问题题聚焦在分类、回归。

深度学习的局限性：
（1）表达能力的限制：深度学习的变量和深度都是有限的，对于现实世界来说，深度学习来描述数据的复杂度还不够复杂；深度学习对数据的需求量随着模型的增大而增大，但现实中有那么多高质量数据的情况还不多。
（2）缺乏反馈机制：目前深度学习对图像识别、语音识别等问题来说是最好的，但是对其他问题不是最好的，特别是有延迟反馈的问题，例如机器人的行动。

2.2、强化学习（Reinforcement Learning,RL）

强化学习，又称再励学习、评价学习或增强学习。

强化学习是智能体（Agent）以“试错”的方式进行学习，通过与环境进行交互获得的奖赏指导行为，目标是使智能体获得最大的奖赏。

强化学习不同于连接主义学习中的监督学习，主要表现在强化信号上，强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价（通常为标量信号），而不是告诉强化系统RLS(reinforcement learning system)如何去产生正确的动作。
参考1

2.3、迁移学习（Tranfer Learning,TL）

所谓迁移学习，或者领域适应（Domain Adaptation），一般就是要将从源领域（Source Domain）学习到的东西应用到目标领域（Target Domain）上去。源领域和目标领域之间往往有gap/domain discrepancy。

迁移学习的四种方法：
1、样本迁移（Instance-based Transfer Learning）
一般是对样本进行加权，给比较重要的样本较大的权重。
样本迁移即在数据集（源领域）中找到与目标领域相似的数据，把这个数据放大多倍，与目标领域的数据进行匹配。其特点是：需要对不同例子加权；需要用数据进行训练。
2、特征迁移（Feature-based Transfer Learning）
3、模型迁移（Model-based Transfer Learning）
整个模型应用到目标领域去，比如目前常用的对预训练好的深度网络做微调，也可以叫参数迁移。
4、关系迁移（Relational Transfer Learning）
社会网络，社交网络之间的迁移，比如师生关系迁移到上下级关系，生物病毒传播迁移到网络病毒传播。

总结：机器学习的昨天，今天和明天
昨天：深度学习：大量数据，特征，准确性
今天：强化学习：大量数据，反馈，策略
明天：少量数据：学习方法，冷启动、个性化