人工智能知识全面讲解：机器学习的类型

最新推荐文章于 2024-06-13 18:32:50 发布

Lee达森

最新推荐文章于 2024-06-13 18:32:50 发布

阅读量2.7k

点赞数

分类专栏：人工智能知识全面讲解文章标签：人工智能机器学习

本文链接：https://blog.csdn.net/tysonchiu/article/details/125393771

版权

人工智能知识全面讲解专栏收录该内容

36 篇文章 17 订阅

订阅专栏

本文详细介绍了机器学习的四种主要方法：有监督学习、无监督学习、半监督学习和强化学习。有监督学习依赖带标签的数据，如人工神经网络、支持向量机等；无监督学习则在无标签数据中找寻内在关系，如聚类问题；半监督学习结合少量标签数据和大量无标签数据；强化学习通过不断试错和反馈提升决策能力，如AlphaGo。选择哪种学习方式取决于业务场景和数据特性。

摘要由CSDN通过智能技术生成

产品经理在日常工作中经常要用到一些理论方法来帮助解决问题。例如，
在需求调研阶段，使用深度?谈、焦点小组、问卷调查、可用性测试等方法获
得用户的真实反馈。在需求分析阶段，使用KANO模型、RFM模型、重要性象限
判断等方法划分需求优先级。选择方法的关键是看使用场景以及不同产品的特
性。在机器学习方面同样也有很多不同的算法，选择算法的关键是看数据的类
型和待解决的问题。
如图1-8所示，机器学习最常见的分类方式是根据数据有无标签分为四
类：数据全部有标签的情况称为有监督学习，这种学习通过已有的一部分输入
数据与输出数据之间的关系生成一个函数，再将输入数据映射到合适的输出数
据；数据没有标签的情况称为无监督学习，这种学习直接对输入数据进行建
模，挖掘数据之间的潜在关系；部分数据有标签的情况称为半监督学习和强化
学习，前者综合利用有标签的数据和没有标签的数据，生成合适的分类函数，
后者通过观察反馈自己去学习。以上几种学习方式并无优劣之分，只是应用
场景不同。

1.4.1 有监督学习
大人们教导幼儿学习事物的类别时，会明确告诉幼儿哪些是书，哪些是桌
子。类比到机器学习中，幼儿眼中看到的景物就是输入数据，大人们告诉幼儿
的判断结果就是相应的输出。当幼儿见识多了以后，脑子里慢慢就会形成直观
的感觉，记住这些事物的特点，这相当于通过训练得到了想要找到的函数，因
而?次不需要别人告诉他们，他们就可以自己去判断哪些是书，哪些是桌子。
这个过程叫作有监督学习（Supervised Learning）。
有监督学习的训练集要求每一条数据都包括输入和输出，也就是说必须
带有特征和分类结果。训练集中的分类结果是人为标注好的，有监督学习是
一个通过已有训练样本的输入与输出训练模型，再利用这个模型将所有的新输
入数据映射为相应的输出，对输出进行判断从而实现分类的过程。最终模型具
备了对未知数据分类的能力。有监督学习的目标是让计算机去学习我们已经创
建好的分类系统。例如，在垃圾邮件检测中，模型的训练数据都是提前区分好
的垃圾邮件与正常邮件，我们不需要机器去定?什么是垃圾邮件，只需要机器
找到垃圾邮件出现的规律即可。
有监督学习是最常见的传统机器学习算法，如人工神经网络、支持向量
机、K近邻法、朴素贝叶斯方法、决策树等都是有监督学习。
1.4.2 无监督学习
当幼儿长大成年之后，在认识世界的过程中经常用到无监督学习。例如，
我们去参观画展，每个人对艺术的认识都不相同，这就需要我们自己去体会作
品，寻找美的感觉。类比到机器学习中我们看到的画作就是输入数据，没有人
告诉我们哪些画是更美的作品。看多了以后，我们会形成自己的审美标准，也
就相当于通过大量的画作找到了一个函数，?次面对新的画作时，我们可以用
自己的审美方式去评价这幅作品。这样一个过程就叫作无监督学习
（Unsupervised Learning）。
无监督学习的训练集使用无标签的数据，也叫无输出数据。每一条数据没
有所谓的“正确答案”，模型必须自己搞明白最后呈现的是什么。无监督学习
的目标不是告诉计算机怎么做，而是让计算机自己去学习怎么做，自己去探
索数据并找到数据的规律。我们常说的“物以类聚，人以群分”就是最典型
的例子。只需要把相似度高的东西放在一起，模型就能发现它们的规律。对于
新来的样本，计算新样本与原来样本的相似度后，模型可以按照相似程度对它
们进行归类。当我们在做营销方案时，经常会遇到没有任何分群依据的情况，
这时候用无监督学习可以识别有相同属性的顾客群，从而在营销活动中以同样
的方式对待这些客户，同时也可以通过模型找到适合这个活动的客户的特点，
从而为营销建议提供决策支持。
有别于有监督学习网络，无监督学习网络在学习过程中并不知道其分类结
果是否正确。无监督学习的特点是仅仅从样本中找出某个类别的潜在规律。常
见的聚类问题都属于无监督学习。
1.4.3 半监督学习
通常我们能够使用有监督学习得到一个性能更好、泛化能力更强的模型。
有监督学习最大的限制条件在于必须使用带有标签的数据。在如今数据爆炸的
时代，想要给数万亿的数据都打上标签是不太现实的事情。在图像识别领域，
我们可以轻易地收集到几十万或上百万张关于桌子、椅子、书本和玩具的图
片，但是要对每一张图片都打上标签，标明哪张图片是桌子，哪张是椅子，代
价非常高，是一项耗时耗力的工作。我们在实际项目中拿到的往往是其中只有
少量数据有标签的海量数据，这种情况非常不利于使用有监督学习方法。
半监督学习（Semi-supervised Learning）就是为解决上述问题而产生
的，其目的在于利用海量未带标签数据，辅之以少量带标签数据进行学习训
练，增强计算机的学习能力。半监督学习在训练阶段结合了大量无标签数据
和少量标签数据。虽然无标签数据不能够提供类别信息，但是这些数据中蕴含
了大量的数据分布信息，这些规律对模型学习起到正向帮助的作用。
半监督学习可被进一步划分为纯半监督学习和直推学习。纯半监督学习假
定训练数据中的未标记样本并非待预测数据，而直推学习假定学习过程中所考
虑的未标记样本就是待预测数据，学习的目的就是在未标记样本上获得最优泛
化性能。也就是说纯半监督学习基于开放世界的假设，希望学得的模型能适用
于训练过程中未观察到的数据；而直推学习基于封闭世界假设，仅试图对学习
过程中观察到的未标记数据进行预测。对此，产品经理只需了解即可，不需要
深入了解两种学习的区别。
半监督学习结合了有监督学习与无监督学习的特点，利用有标签数据的局
部特征和分类方式，以及更多无标签数据的整体分布情况，就可以得到比单一
数据源更好的分类结果。
1.4.4 强化学习
AlphaGo的表现让很多人认识到强化学习的威力，通过这一方式训练出来
的模型竟能达到如此智能的地步。强化学习（Rein?orcement Learning）会在
没有任何标签的情况?，先尝试做出一些动作得到一个结果，通过这个结果的
反馈，调整之前的行为。通过不断的调整，算法强化自身的决策能力，最终能
够根据不同的情况，获得不同的决策结果。
这种学习方式和有监督学习有点类似，它们都会学习从输入到输出的一个
映射。但有监督学习输出的是数据之间的关系，可以告诉算法一个输入对应什
么样的输出。所谓强化学习就是智能系统从环境到行为映射的学习，目的是获
得最大的奖励信号。也就是说强化学习输出的是给机器的反馈，用来判断这个
行为是正确的还是错误的。另外，强化学习的结果反馈有延时，有时候可能在
走了很多步以后才知道前面某一步选择的优劣，而有监督学习做了比较坏的选
择之后会立刻反馈给算法。
有监督学习就好比有家长陪伴的学习，家长会马上告诉幼儿对错，纠正幼
儿的错误。而强化学习就好比有一只还没有训练好的小狗，每当它把屋子弄乱
后，主人就减少狗粮的数量。每次表现不错时，狗粮的数量就加倍。在这个过
程中，先做一次小狗弄乱房间的试验，最终获得一个减少狗粮的负反馈结果，
接?来小狗要是表现很好就获得一个增加狗粮的正反馈结果，这样反复很多次
后，小狗会知道把客厅弄乱是不好的行为。
虽然强化学习和无监督学习都使用无标签数据进行学习，但两者之间有很
大的区别。例如在向用户推荐新闻的任务中，无监督学习会找到用户先前已经
阅读过的类似新闻，并向他们推荐一个同类的新闻；而强化学习则通过向用户
推荐少量新闻的方式，获得来自用户的反馈，最后构建用户可能会喜欢的新闻
的“知识图”。选择哪种学习方式，主要看业务场景的需要以及具体问题下
的实现难度。