周志华《机器学习》（西瓜书）学习笔记——第一章绪论

最新推荐文章于 2024-01-20 22:58:37 发布

Bread Sir

最新推荐文章于 2024-01-20 22:58:37 发布

阅读量454

点赞数

分类专栏：西瓜书 Marchine Learning 文章标签：机器学习

本文链接：https://blog.csdn.net/karry_zzj/article/details/86547260

版权

13 篇文章 1 订阅

订阅专栏

9 篇文章 7 订阅

订阅专栏

以上，一般地，令 $\{\mathbf{ x_1, x_2, ..., x_m}\}$ 表示包含m个示例的数据集，每个示例由 $d$ 个属性描述。其中 $x_{ij}$ 是 $\mathbf{x_i}$ 在第 $j$ 个属性上的取值， $d$ 称为样本 $x_i$ 的“维数”。

训练 / 学习：从数据中学得模型的过程。训练过程中使用的数据称为 训练数据，其中每个样本称为一个 “训练样本”，训练样本组成的集合称为“训练集”。
假设：学得模型对应了关于数据的某种潜在的规律。
标记：关于示例结果的信息，如“好瓜”。
样例：拥有了标记信息的示例。一般地，用 $(\mathbf{x_i},y_i )$ 表示第 $i$ 个样例，其中 $y_i ∈ Y$ 是示例 $\mathbf{x_i}$ 的标记， $Y$ 是所有标记的集合，也称“标记空间 ”或“输出空间”。
分类：预测离散值的学习任务。
回归：预测连续值的学习任务。
二分类任务：只涉及两个类别的学习任务，其中一个类为“正类”，另一个类为“反类”。
多分类任务：设计多个类别的任务。