周志华《机器学习》第一章笔记+公式推导+课后习题

最新推荐文章于 2022-01-17 00:29:12 发布

Zoro1996

最新推荐文章于 2022-01-17 00:29:12 发布

阅读量1.4k

点赞数 1

分类专栏：个人学习人工智能文章标签：机器学习西瓜书

本文链接：https://blog.csdn.net/qq_33997826/article/details/94454222

版权

文章目录

用作者的话说，本书的主要目的就是为读者提供一张“初级地形图“，给初学者指路。故西瓜书的第一章主要介绍何为机器学习、机器学习相关基础概念、发展历程以及应用现状，力求使读者能够一窥机器学习全貌。

一、何为机器学习

人类可以学习经验对新情况做出判断，那么计算机要怎么做这件事呢？

机器学习正是这样一门学科，他致力于研究如何通过计算的手段，利用经验来改善系统自身的性能，在计算机中，“经验”通常以“数据”形式存在，因此，机器学习所研究的主要内容，是关于在计算机上从数据中产生“模型”的算法，即“学习算法”。

也就是说，机器学习致力于研究如何产生“模型”的学习算法。当有了“学习算法”，我们把经验数据丢给它，就会得到一个“模型”。在面临新的数据时，“模型”便会做出相应的判断。

二、基本术语与基本概念

2.1 基本术语

样本（sample），又称示例（instance），是关于对象的一个描述，记作 $\vec{x}$ .
数据集（data set），若干样本的集合，记作 $\vec{D}$ ={ $\vec{x_1}$ , $\vec{x_2}$ ,…, $\vec{x_m}$ }.
属性（attribute），又称特征（feature），反映对象在某方面的表现或者性质.
属性值（attribute value），属性的取值.
属性空间（attribute space），又称样本空间（sample space），是属性张成的空间，记作 $\chi$ .

一般的，令 $\vec{D}=({\vec{x_1},\vec{x_2},...,\vec{x_m}})$ 表示包含m个示例的数据集，每个示例由 $d$ 个属性组成， $\vec{x_i}=(x_{i1},x_{i2},...,x_{id})$ 是 $d$ 维属性空间 $\chi$ 的一个向量, $\vec{x_i}\in\chi$ ,其中 $x_{ij}$ 是 $\vec{x_i}$ 的第 $j$ 个属性的取值。

从数据中通过“学习算法”学得模型的过程叫做”训练“或者“学习”，每个样本叫做“训练样本”，“训练样本”组成“训练集”。学得模型对应了数据的某种潜在规律，因此学得模型也可称为“假设”，可用 $h (x)$ 表示，相应的潜在规律用 $f (x)$ 表示。学习的过程就是不断调整 $h (x)$ 来逼近 $f (x)$ 。

为了能够学习数据并进行预测，除了“示例”，还需要“示例的结果”，又称“标签”（ $l a b e l$ ）。示例+标签=样例，常用 $(\vec{x_i},y_i)$ 表示，其中 $y_i\in\gamma$ 是示例 $\vec{x_i}$ 的标记， $\gamma$ 是所有标记的集合，称为“标记空间”或者“输出空间”。

学得模型之后，利用其进行预测的过程称为“测试”。例如在学得 $f$ 之后，对测试例 $x$ ，可得其预测标记 $f (x)$ 。

一般的，预测任务是希望通过对训练集 $\{(\vec{x_1},y_1),(\vec{x_2},y_2),...,(\vec{x_m},y_m)\}$

最低0.47元/天解锁文章

Zoro1996

关注

1
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
周志华《机器学习》第一章笔记+公式推导+课后习题

之前五月份因为要做一个水果分类的比赛，强行突击了台湾大学李宏毅老师的机器学习视频课，做比赛是够用了，但是没有系统的学习梳理过知识体系。暑假争取把导师推荐的书刷一遍，再做几个小项目，在开学之前把自己与别人的差距尽量缩小一些。Go fighting！用作者的话说，本书的主要目的就是为读者提供一张“初级地形图“，给初学者指路。故本书第一章主要介绍何为机器学习、机器学习相关基础概念、发展...
复制链接

扫一扫