自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 第二章——模型评估与选择 Part3

在开始今天的部分之前,我们先搬出上一部分的思维导图。   有了模型,有了测试集,就是有了测试结果。那如何来评估测试结果呢?我们要确定一个评估指标。 指标一:错误率、精度 错误率和精度是最常用的两种度量方法。错误率是分类错误的样本数量占总样本数量的比例,精度就是分类正确的样本数量占总样本数量的比例。 虽然常用,但是题目的局限性还是很明显的。比如,无法回答:预测为真的所有样本中,到底有多...

2018-07-29 21:49:03 377

原创 第二章——模型评估与选择 Part 2

上一个部分,讲到最终我们要选择的模型应该是泛化误差最小的。那这部分,我们来进一步学习Min(泛化误差)这件事。 首先,我们来看这样一个思维导图。针对机器学习的数据,我们可以把他们分为三大类:训练集(Training),验证集(Validation),测试集(Testing)。我们之前说过,测试集是用来衡量泛化误差的,所以在这里我们都是围绕着测试集做文章。在这里我们需要知道:用测试集近似衡量泛化误...

2018-07-28 21:19:31 332

原创 第二章——模型评估与选择 Part 1

本章节继续介绍机器学习的一些基础性的,原则性的概念。我认为,本章节作者想要交给大家的,是一把能够衡量模型好坏的尺子。 当学习一个新的东西时,我喜欢先从一定的高度看个全景。所以我们先坐上电梯到18楼来看一下。 首先,当我们站在全局的观点上,我们希望得到什么样的模型? 答案是:泛化误差小的模型,在新样本上表现好的模型。 这一点其实非常好理解,我们就拿学校里的考试作比方。平时课后练习做的好,并不...

2018-07-27 23:37:37 190

原创 第一章——绪论

在开始西瓜书系列之前,首先声明一下:作者并不是一个专业的程序员,只是跨界而来,想看看所谓的机器学习究竟是一片怎样的风景。一千个人眼中有一千个哈姆雷特。同样的,面对同一本书,每个人的理解是不同的。在这个读西瓜书的系列笔记中,我仅以自己所熟悉的那些知识和背景出发,来记录自己的读书历程。 1. 什么是机器学习。 大段的标准化的定义我们就免去了。就我的理解而言,先是有了一个T-Task,接着我们得到了...

2018-07-25 01:15:42 174

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除