【人工智能】— 学习与机器学习、无/有监督学习、强化学习、学习表示-CSDN博客

本文链接：https://blog.csdn.net/weixin_56462041/article/details/131030692

文章介绍了机器学习的基本概念，包括监督学习、无监督学习、半监督学习和强化学习。监督学习涉及输入和所需输出，无监督学习则寻找数据中的模式，强化学习关注智能体在环境互动中学习策略。此外，文章还讨论了特征向量在表示对象中的作用，以及在不同领域的应用，如语音识别和信息检索。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

【人工智能】— 学习与机器学习、无/有监督学习、强化学习、学习表示

上一章
Bayesian Networks
本章：观测学习
学习
学习元素
机器学习概论
机器学习
- 机器学习：定义
电子邮件过滤问题
学习类型
在机器学习中表示“对象”
特征向量表示
关键要素

Bayesian Networks

贝叶斯网络提供了一个自然的表示方式，用于描述（因果引起的）条件独立性。

拓扑结构 + 条件概率表 = 联合分布的紧凑表示。
通常易于领域专家构建。
通过变量消除进行精确推断：
- 在有向无环图上的时间复杂度是多项式级别的，但在一般图上为 NP-hard。
- 空间复杂度与时间复杂度相同，非常敏感于拓扑结构。
Naive Bayes 模型是一种特殊的贝叶斯网络。

本章：观测学习

观测学习是机器学习的一种方法，其目标是从数据中推断出未知的模型或概率分布。观测学习通常包括数据收集、选择假设空间、使用学习算法选择最优模型、评估和调整等步骤。它可以应用于多种任务，包括分类、回归、聚类、降维和异常检测等。观测学习的优点是可以自动学习模型，无需手动指定模型的形式或参数。常见的观测学习算法包括决策树、神经网络、支持向量机、朴素贝叶斯、最大熵模型和隐马尔可夫模型等。

学习

学习在人工智能和机器学习中扮演着重要的角色，它允许智能体从经验中提取知识和信息，并将其应用于新的任务和环境中。学习可以分为有监督学习、无监督学习和强化学习等不同类型，每种类型都有其独特的应用和算法。学习的重要性在于它可以使智能体适应不断变化的环境和任务，而不需要重新编写程序或重新设计系统。尽管学习有很多优点，但也存在一些挑战和限制，例如需要大量的数据和计算资源来训练模型，需要考虑数据偏差和过拟合等问题，还需要平衡探索和利用等问题。

学习元素

设计学习元素受以下因素的影响：

需要学习哪些性能元素的组成部分。
可用于学习这些组成部分的反馈信息是什么。
用于这些组成部分的表示方法是什么。

学习元素是机器学习系统的核心组成部分，包括算法、模型和数据等组成部分。学习元素的目的是让智能体能够从经验中学习知识和信息，以优化其性能和决策。学习元素的设计需要考虑到任务和环境，并根据具体情况进行调整和优化。反馈信息、算法和模型的选择、以及表示方法也是学习元素设计的重要因素。

机器学习概论

机器学习对什么有用

自动语音识别

现在，大多数语音识别器或翻译器都能学习——你使用它们越多，它们就越聪明

计算机视觉

例如物体、人脸和笔迹识别
在这里插入图片描述

Information retrieval—信息检索

阅读、消化和分类庞大的文本数据库对人类的网页检索来说太多了
(检索）分类(分类）聚类(聚类）页面之间的关系在这里插入图片描述

机器学习

机器学习是一个交叉学科的领域，涵盖了数学、计算机科学、工程学、统计学、认知科学、心理学、计算神经科学、经济学等领域。

其目的是通过利用数据来训练模型或算法，以便能够自动化地完成某些任务，并且能够从经验中不断改进自身的性能。

机器学习涉及的模型和算法包括线性回归、逻辑回归、决策树、支持向量机、神经网络、贝叶斯网络、隐马尔可夫模型、聚类、降维等。通过学习机器学习，可以掌握一些重要的概念、技术和工具，为今后的学习和实践打下基础。

机器学习：定义

Tom Mitchell（1998）提出了机器学习的定义：如果一个计算机程序在某个任务T上的性能，通过某种性能度量P，随着经验E的增加而提高，那么它就可以说是从经验E中学习到了任务T。

这个定义强调了机器学习的本质：通过从数据中获取知识和经验，来提高计算机程序在某些任务上的性能。其中，任务T可以是各种各样的，包括分类、回归、聚类、识别等；性能度量P可以是准确率、精确率、召回率、F1值、AUC值等；经验E可以是训练数据、验证数据、测试数据等。

电子邮件过滤问题

假设您的电子邮件程序观察您标记为垃圾邮件或非垃圾邮件的邮件，并基于此学习如何更好地过滤垃圾邮件。在这种情况下，任务T是什么？

A. 将电子邮件分类为垃圾邮件或非垃圾邮件。
B. 观察您标记为垃圾邮件或非垃圾邮件的邮件。
C. 正确分类为垃圾邮件/非垃圾邮件的电子邮件数量（或比例）。
D. 以上都不是——这不是一个机器学习问题。

答案：A. 将电子邮件分类为垃圾邮件或非垃圾邮件。

学习类型

假设有一个智能体或机器，它接收到一系列的感知输入： $x_1, x_2, x_3, x_4, ...$

监督学习

在监督学习中，机器还会收到所需的输出 $y_1, y_2, ...$ ，其目标是在给定新输入的情况下学习生成正确的输出。这被称为监督学习。在这种类型的学习中，机器被提供带有标签的示例，目标是学习一个将输入映射到输出的函数。常见的示例包括图像分类和语音识别。

无监督学习

在无监督学习中，没有给出所需的输出 $y_1, y_2, ...$ ，但智能体仍然希望构建一个可以用于推理、决策、预测和通信等目的的 $x$ 模型。目标是发现输入数据中的模式、结构和关系。示例包括聚类、降维和异常检测。

半监督学习

半监督学习是监督学习和无监督学习的结合。在这种类型的学习中，机器被提供一些带标签的示例和一些无标签的示例。目标是学习一个可以推广到新的、未见过的示例的函数。当标记数据稀缺或昂贵时，这种类型的学习非常有用。

强化学习

强化学习是一种学习类型，智能体在与环境交互并获得奖励或惩罚的形式的反馈时进行学习。目标是学习一个策略，以在复杂、动态的环境中最大化预期的累积奖励。这种类型的学习在机器人、游戏和其他需要学习在复杂、动态环境中做出决策的应用程序中使用。

在机器学习中表示“对象”

一个例子或实例 $x$ 代表一个特定的对象
通常用一个 $d$ 维特征向量 $(x_1, . . . , x_d) \in \mathbb{R}^d$ 表示 $x$
每个维度称为特征或属性
特征可以是连续或离散的
$x$ 是特征空间中的一个点，维度为 $d$
对象的抽象表示。忽略任何其他方面（例如，两个具有相同体重和身高的人可能被认为是相同的）

特征向量表示

对于文本文档：
- 词汇表的大小为 $d$ （大约100,000个词）
- “词袋模型”：计算每个词汇项的出现次数
- 通常会删除停用词：the、of、at、in等
- 特殊的“未知词汇”（OOV）条目可以捕获所有未知词汇
对于图像：
- 像素、颜色直方图等
- 通过卷积进行特征提取
对于软件：
- 执行概况：每行代码执行的次数
对于银行账户：
- 信用评级、余额、最近一天、一周、一个月、一年的存款次数、取款次数等
对于你和我：
- 医学检测1、检测2、检测3等

关键要素

数据
数据集 $D$ 包含 $N$ 个数据点：
$D = \{x_1, x_2, ..., x_N\}$
预测
我们通常希望基于观察到的数据集进行预测。
给定 $D$ ，我们能否预测 $x_{N+1}$ ？
模型
为了进行预测，我们需要做一些假设。我们通常可以用模型的形式来表达这些假设，其中包含一些参数。
给定数据 $D$ ，我们从中学习模型参数 $\theta$ ，从而可以预测新的数据点。