理论上是人-CSDN博客

原创第二章——模型评估与选择 Part3

在开始今天的部分之前，我们先搬出上一部分的思维导图。有了模型，有了测试集，就是有了测试结果。那如何来评估测试结果呢？我们要确定一个评估指标。指标一：错误率、精度错误率和精度是最常用的两种度量方法。错误率是分类错误的样本数量占总样本数量的比例，精度就是分类正确的样本数量占总样本数量的比例。虽然常用，但是题目的局限性还是很明显的。比如，无法回答：预测为真的所有样本中，到底有多...

2018-07-29 21:49:03 377

上一个部分，讲到最终我们要选择的模型应该是泛化误差最小的。那这部分，我们来进一步学习Min(泛化误差)这件事。首先，我们来看这样一个思维导图。针对机器学习的数据，我们可以把他们分为三大类：训练集(Training)，验证集(Validation)，测试集(Testing)。我们之前说过，测试集是用来衡量泛化误差的，所以在这里我们都是围绕着测试集做文章。在这里我们需要知道：用测试集近似衡量泛化误...

2018-07-28 21:19:31 332

原创第二章——模型评估与选择 Part 1

本章节继续介绍机器学习的一些基础性的，原则性的概念。我认为，本章节作者想要交给大家的，是一把能够衡量模型好坏的尺子。当学习一个新的东西时，我喜欢先从一定的高度看个全景。所以我们先坐上电梯到18楼来看一下。首先，当我们站在全局的观点上，我们希望得到什么样的模型？答案是：泛化误差小的模型，在新样本上表现好的模型。这一点其实非常好理解，我们就拿学校里的考试作比方。平时课后练习做的好，并不...

2018-07-27 23:37:37 190

原创第一章——绪论

在开始西瓜书系列之前，首先声明一下：作者并不是一个专业的程序员，只是跨界而来，想看看所谓的机器学习究竟是一片怎样的风景。一千个人眼中有一千个哈姆雷特。同样的，面对同一本书，每个人的理解是不同的。在这个读西瓜书的系列笔记中，我仅以自己所熟悉的那些知识和背景出发，来记录自己的读书历程。 1. 什么是机器学习。大段的标准化的定义我们就免去了。就我的理解而言，先是有了一个T-Task，接着我们得到了...

2018-07-25 01:15:42 174

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

weixin_39800127的博客

原创第二章——模型评估与选择 Part3

原创第二章——模型评估与选择 Part 2

原创第二章——模型评估与选择 Part 1

原创第一章——绪论

空空如也

空空如也

原创 第二章——模型评估与选择 Part3

原创 第二章——模型评估与选择 Part 2

原创 第二章——模型评估与选择 Part 1

原创 第一章——绪论

空空如也

空空如也

原创第二章——模型评估与选择 Part3

原创第二章——模型评估与选择 Part 2

原创第二章——模型评估与选择 Part 1

原创第一章——绪论