机器学习（周志华版）第一章笔记

最新推荐文章于 2022-10-06 22:36:50 发布

Jasonare

最新推荐文章于 2022-10-06 22:36:50 发布

阅读量1.2k

点赞数 1

分类专栏：机器学习文章标签：机器学习深度学习

本文链接：https://blog.csdn.net/qq_38996065/article/details/107067772

版权

机器学习专栏收录该内容

1 篇文章 2 订阅

订阅专栏

Introduction

1、define

(1)机器学习是这样一个领域，它赋予计算机学习的能力，(这种学习能力)不是通过显著式编程获得的。

注：显著式编程是需要人为地根据周围的环境、规则、经验等给计算机规定一些机械化步骤或判断依据，例如识别菊花和玫瑰，显著式编程就需要人为规定黄色的是菊花，红色的是玫瑰。而非显著式编程无需人为给出所有的步骤和约束计算机必须总结什么规律，只需要定义收益函数，计算机会通过与环境的互动总结经验、调整策略，从而实现最大化收益(最优策略)。因此，非显著编程更加灵活，适用范围更广。

(2)一个计算机程序被称为可以学习，是指她能够针对某个任务T和某个性能指标P，从经验E中学习。这种学习的特点是，它在T上的被P所衡量的性能，会随着经验E的增加而提高。

注：还是以识别菊花和玫瑰为例，任务T指的是编写一个计算机程序来识别菊花和玫瑰、经验E指的是海量的菊花和玫瑰的图片(称之为“训练样本”)、性能指标P指的是识别率(识别结果的正确率)，这种算法的特点就是随着图片(经验/训练样本)的增加，识别率(性能指标)也会越来越高。(泛化)

2、category

(1)监督学习(Supervised Learning)：所有的经验都是人为搜集起来并输入计算机的，最终为训练数据打上标签或者进行预测。例如识别垃圾邮件、人脸识别、图像识别、天气预测、污染物浓度预测等。

注1：若我们欲预测的是离散值，例如“垃圾邮件”和“正常邮件”，此类学习任务称为“分类”；若欲预测的是连续值，例如污染物浓度1.5%,4.8%，此类学习任务称为“回归”。

注2：传统的监督学习包括支持向量机SVM(Support Vector Machine)、人工神经网络、深度神经网络DNN(Deep Neutral Network)

(2)无监督学习(Unsupervised Learning)：只有特征，但是没有标签，即给定数据，‘寻找隐藏/潜在的结构和信息，进行分类。例如聚类、社交网络分析、群体分类。

注：无监督学习算法包括聚类、EM算法、主成分分析

(3)半监督学习(Semi-supervised Learning)：由于标注数据是成本巨大的工程，因此，利用少量标注的数据和大量未标注的数据一起训练出一个更好的机器学习方法，即半监督学习算法，是一种趋势。

(4)强化学习(Reinforcement Learning)：计算机通过与环境的互动，逐渐强化自己的行为模式，从而实现最大化收益的学习过程称为强化学习。

3、term/concept

(1)归纳学习：归纳学习是符号学习中研究的最为广泛的学习。给定关于某个概念的一系列已知的正例和反例，其任务是从中归纳出一个一般的概念描述。其中狭义的归纳学习要求从训练数据中学得概念，因此亦称为“概念学习”。

(2)假设空间：我们可以把学习过程看作一个在所有假设组成的空间中进行搜索的过程，搜索目标是找到与训练集“匹配”的假设，即能够将训练集所有数据判断正确的假设。

(3)版本空间：由于假设空间可能很大，我们把与训练集匹配的假设(可能有多个)组合成一个集合，这样的一个集合我们称之为“版本空间”。

(4)归纳偏好：对于版本空间中不同的假设，在面临测试样本可能会有不同的输出，此时如果不规定一个偏好(选择)，则针对同一个数据可能会有不同的输出，这种学习结果显然没有意义。

注：“奥卡姆剃刀”指的是归纳偏好选取相对最简单的那个(但是哪一个假设最简单并没有一个通用的标准)

4、process

(1)特征提取(Feature Extraction)：通过训练样本获得对机器学习任务有帮助的多维度数据。

(2)特征选择(Feature Selection)：从若干个特征中选取对机器学习任务帮助显著的特征，即有效特征。

(3)基于特征构造算法：若选取了N个特征构成N维的特征空间，则机器学习算法需要做的就是要把特征空间中进行划分，尽可能将不同特征的样本数据区分开。

注1：不同的算法对特征空间的划分是不同的，从而产生的结果也不同。因此，如何在不同的应用场景选取或构造合适的机器学习算法是机器学习领域的一个重要的课题。

注2：在设计机器学习算法的时候，有一个假设：在特征空间上距离较近的样本，它们属于同一个类别的概率会更高。

5、theory-“没有免费的午餐”

任何一个预测函数，如果在一些训练样本上表现好，那么必然在一些训练样本上表现不好。也就是说，如果不对数据在特征空间的先验分布有一定的假设，那么表现好和表现不好的概率一样多(所有算法的表现都一样)。

6、conclusion

机器学习的本质：通过有限的已知样本数据，在复杂的高维特征空间中预测未知样本的属性和类别。

Jasonare

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
机器学习（周志华版）第一章笔记

Introduction1、define(1)机器学习是这样一个领域，它赋予计算机学习的能力，(这种学习能力)不是通过显著式编程获得的。注：显著式编程是需要人为地根据周围的环境、规则、经验等给计算机规定一些机械化步骤或判断依据，例如识别菊花和玫瑰，显著式编程就需要人为规定黄色的是菊花，红色的是玫瑰。而非显著式编程无需人为给出所有的步骤和约束计算机必须总结什么规律，只需要定义收益函数，计算机会通过与环境的互动总结经验、调整策略，从而实现最大化收益(最优策略)。因此，非显著编程更加灵活，适用范围更广
复制链接

扫一扫