- 博客(4)
- 收藏
- 关注
原创 第二章——模型评估与选择 Part3
在开始今天的部分之前,我们先搬出上一部分的思维导图。 有了模型,有了测试集,就是有了测试结果。那如何来评估测试结果呢?我们要确定一个评估指标。 指标一:错误率、精度 错误率和精度是最常用的两种度量方法。错误率是分类错误的样本数量占总样本数量的比例,精度就是分类正确的样本数量占总样本数量的比例。 虽然常用,但是题目的局限性还是很明显的。比如,无法回答:预测为真的所有样本中,到底有多...
2018-07-29 21:49:03 377
原创 第二章——模型评估与选择 Part 2
上一个部分,讲到最终我们要选择的模型应该是泛化误差最小的。那这部分,我们来进一步学习Min(泛化误差)这件事。 首先,我们来看这样一个思维导图。针对机器学习的数据,我们可以把他们分为三大类:训练集(Training),验证集(Validation),测试集(Testing)。我们之前说过,测试集是用来衡量泛化误差的,所以在这里我们都是围绕着测试集做文章。在这里我们需要知道:用测试集近似衡量泛化误...
2018-07-28 21:19:31 332
原创 第二章——模型评估与选择 Part 1
本章节继续介绍机器学习的一些基础性的,原则性的概念。我认为,本章节作者想要交给大家的,是一把能够衡量模型好坏的尺子。 当学习一个新的东西时,我喜欢先从一定的高度看个全景。所以我们先坐上电梯到18楼来看一下。 首先,当我们站在全局的观点上,我们希望得到什么样的模型? 答案是:泛化误差小的模型,在新样本上表现好的模型。 这一点其实非常好理解,我们就拿学校里的考试作比方。平时课后练习做的好,并不...
2018-07-27 23:37:37 190
原创 第一章——绪论
在开始西瓜书系列之前,首先声明一下:作者并不是一个专业的程序员,只是跨界而来,想看看所谓的机器学习究竟是一片怎样的风景。一千个人眼中有一千个哈姆雷特。同样的,面对同一本书,每个人的理解是不同的。在这个读西瓜书的系列笔记中,我仅以自己所熟悉的那些知识和背景出发,来记录自己的读书历程。 1. 什么是机器学习。 大段的标准化的定义我们就免去了。就我的理解而言,先是有了一个T-Task,接着我们得到了...
2018-07-25 01:15:42 174
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人