《机器学习》二刷超详细笔记第二章模型评估与选择，面试复盘总结怎么写

2401_84104827

于 2024-04-20 10:08:46 发布

阅读量706

点赞数 13

分类专栏： 2024年程序员学习文章标签：机器学习笔记面试

本文链接：https://blog.csdn.net/2401_84104827/article/details/137992158

版权

2024年程序员学习专栏收录该内容

190 篇文章 0 订阅

订阅专栏

先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7

深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！

因此收集整理了一份《2024年最新Java开发全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上Java开发知识点，真正体系化！

由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新

如果你需要这些资料，可以添加V获取：vip1024b （备注Java）

正文

博主在4月学完西瓜书时，一头雾水，觉得还是一知半解。9月开学后上完了必修的《machine learning》课程，并且自己编程实现了多种机器学习算法和论文复现后，才对机器学习有一点了解，现在再次翻阅西瓜书，很多知识点看到都豁然开朗。所以出这一系列文章，对机器学习进行回顾，总结和记录！为大家揭开机器学习的神秘面纱！

1、经验误差与过拟合

通常我们把分类错误的样本数占样本总数的比例称为“错误率”（error rate），即如果在m个样本中有a个样本分类错误，则错误率E=a/m；相应的1-a/m就是“精度”(accuracy)，即“精度=1-错误率”。

我们把学习器的实际预测输出与样本的真实输出之间的差异称为“误差”(error)，学习器在训练集上的误差称为 “训练误差” 或 “经验误差”，在新样本上的误差称为“泛化误差”。

过拟合：学习器把训练样本学的“太好了”，已经把训练样本自身的一些特点当作了所有潜在样本都具有的一般性质，这样就会导致泛化性能下降。
欠拟合：对训练样本的一般性质尚未学好。

有多种因素导致过拟合，其中最常见的就是学习能力过于强大，以至于把训练样本所包含的不太一般的特性都学到了，欠拟合是由于学习能力底下低下造成的。欠拟合比较容易克服，例如在决策树中扩展分支、在神经网络学习中增加训练轮次等；而过拟合很难解决，而且是无法彻底避免的，我们所能做的只是“缓解”，或者说减小其风险。
在这里插入图片描述

2、评估方法

在讲评估方法前，我们先来回顾一下训练集和测试集的概念。

大家从小到大肯定经过无数次期末考试了，对考试一定不会陌生。假设这样一个场景：在考试前，老师发给大家历年的试卷（训练集），让大家回去复习，然后考试时的试卷（测试集）上的题目全部是原题。

训练样本相当于老师给同学们练习的习题，测试过程相当于考试。显示，如果测试样本被用来训练了，那得到的将是过于“乐观”的估计结果，人均90不是梦。（像极了本科的期末考试）

在这里插入图片描述

2.1、留出法

留出法直接将数据集D划分为两个互斥的集合，其中一个集合作为训练集S，另一个作为测试集T，即S∪T=D,S ∩ T=∅。在S上训练出模型后，用T来评估其测试误差，作为对泛化误差的估计。

以二分类任务为例，假定D包含1000个样本，将其划分为S包含700个样本，T包含300个样本，用S进行训练后，如果模型在T上有90个样本分类错误，则错误率为(90/300) x 100%=30%，相应的，精度为1-30%=70%。所以我们可以说这个模型的精度为70%，不能说成准确率哦，后面会谈到准确率。

2.2、交叉验证法

它的思想就是将数据集D分成k个大小相似的互斥子集，即D=D1∪D2∪…U Dk，其中每个子集的交集都为∅。然后，每次用k-1个子集的并集作为训练集，余下的那个子集作为测试集，这样就得到了k组训练/测试集，从而可进行k次训练和测试，最终返回的是这k个测试结果的均值。

交叉验证法评估结果的稳定性和真实性很大程度上取决于k的取值，所以通常把交叉验证法称为“k折交叉验证”，k的常用取值是10，此时称为10折交叉验证。
在这里插入图片描述

2.3、自助法

给定包含m个样本的数据集D，我们对它进行采样产生数据集D’:每次随机从D中选出一个样本，拷贝到D’中，然后再将该样本放回初始数据集D中，使得该样本在下次采样时仍有可能被采到；这个过程重复执行m次，我们就得到了包含m个样本的数据集D’，这就是自助采样。

如果训练集中的样本没有在测试集中出现过，那么这样的测试结果称为“包外估计”。

2.4、调参与最终模型

大多数学习算法都有些参数（parameter）需要设定，参数配置不同，学得模型的性能往往有显著差别。因此，在进行模型评估与选择时，除了要对适用算法进行选择，还需要对算法参数进行设定，这就是通常所说的“参数调节”或简称“调参”。（parameter tuning）
在这里插入图片描述

我们已经知道训练集和测试集的概念了，下面来介绍下验证集。

模型评估与选择中用于评估测试的数据集称为“验证集”，也就是说在调参过程中，用来测试模型性能的数据集就叫做验证集，换句话说，验证集就是用来调参和模型选择的。

3、性能度量

独家面经总结，超级精彩

本人面试腾讯，阿里，百度等企业总结下来的面试经历，都是真实的，分享给大家！

Java面试准备

准确的说这里又分为两部分：

Java刷题
算法刷题

Java刷题：此份文档详细记录了千道面试题与详解；

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化的资料的朋友，可以添加V获取：vip1024b （备注Java）

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！
b （备注Java）**
[外链图片转存中…(img-ndQ6SOeh-1713578908858)]

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！