Task01

最新推荐文章于 2024-10-04 22:36:54 发布

qq_62954268

最新推荐文章于 2024-10-04 22:36:54 发布

阅读量146

点赞数

分类专栏：笔记文章标签：人工智能算法 Powered by 金山文档

本文链接：https://blog.csdn.net/qq_62954268/article/details/129018174

版权

笔记专栏收录该内容

7 篇文章 0 订阅

订阅专栏

机器学习的概念

机器学习正是这样一门学科，它致力于研究如何通过计算的手段，利用经验来改善系统自身的性能，在计算机系统中， “ 经验 ” 通常以 “ 数据 ” 形式存在，因此，机器学习所研究的主要内容，是关于在计算机上从数据中产生 “ 模型 ” (model) 的算法，即 “ 学习算法 ” (learning algorithm) 。

基本术语：

引用：

从数据中学得模型的过程称为 “ 学习 ” (learning) 或 “ 训练 ” (training) ，这个过程通过执行某个学习算法来完成．训练过程中使用的数据称为 “ 训练数据 ” (training data) ，其中每个样本称为一个 “ 训练样本 ” (training sample) ，训练样本组成的集合称为 “ 训练集 ” (training set). 学得模型对应了关于数据的某种潜在的规律，因此亦称 “ 假设 ” (hypothesis); 这种潜在规律自身，则称为 “ 真相 ” 或 “ 真实 ” (ground-truth) ，学习过程就是为了找出或逼近真相．本书有时将模型称为 “ 学习器 ” (learner) ，可看作学习算法在给定数据和参数空间上的实例化。建立这样的关于 “ 预测 ” (prediction) 的模型，我们需获得训练样本的 “ 结果 ” 信息，这里关于示例结果的信息，例如 “ 好瓜 ”称为 “ 标记 ” (label); 拥有了标记信息的示例，则称为 “ 样例 ” (example)。（《机器学习》-周志华，第一章绪论）

假设空间：

我们可以把学习过程看作一个在所有假设（ hypothesis ）组成的空间中进行搜索的过程，搜索目标是找到与训练集 “ 匹配 ” 的假设，即能够将训练集中的瓜判断正确的假设，假设的表示一旦确定，假设空间及其规模大小就确定了。

归纳偏好：

对于一个具体的学习算法而言，它必须要产生一个模型。然而它对应的模型可能有很多个，那么要选择哪一个模型，就属于这个算法的”偏好“。这个”偏好“不是我们认为决定的，它取决于算法能否取得好的性能，这样算法的”偏好“才会与问题本身匹配。

引用：

所以， NFL 定理最重要的寓意，是让我们清楚地认识到，脱离具体问题，空泛地谈论 “ 什么学习算法更好 ” 毫无意义，因为若考虑所有潜在的问题，则所有学习算法都一样好，要谈论算法的相对优劣，必须要针对具体的学习问题；在某些问题上表现好的学习算法，在另一些问题上却可能不尽如人意，学习算法自身的归纳偏好与问题是否相配，往往会起到决定性的作用。（《机器学习》-周志华，第一章绪论）