【Machine learning】模型评估与选择（Model Evaluation and Selection）

最新推荐文章于 2023-06-10 10:07:56 发布

潮汐止处

最新推荐文章于 2023-06-10 10:07:56 发布

阅读量980

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/baidu_29894819/article/details/78259376

版权

机器学习专栏收录该内容

6 篇文章 0 订阅

订阅专栏

我们该选择哪一个学习算法、使用哪一种参数配置，这就是机器学习中的模型选择问题。理想的解决方案是对候选模型的泛化误差进行评估，然后选择泛化误差最小的那个模型。但我们无法直接获得泛化误差，训练误差又由于过拟合现象的存在不适合作为标准，如何进行模型评估与选择？

basic terms

1.误差（训练误差和泛化误差）error（training error&generalization error）

误差：把学习器的实际预测输出与样本的真实输出之间的差异称为误差

训练误差：学习器在训练集上的误差

泛化误差：在新样本上的误差

2.过拟合、欠拟合

3.评估方法

用测试集上的‘测试误差’作为泛化误差的近似。

从m个样例数据中产生出训练集S和测试集T：

留出法（hold-out）：直接将数据集合划分为S、T，S与T互斥（一般要进行若干次随机划分、重复进行试验评估后取平均值）。适用于数据集较大的情况。
交叉验证法（cross validation）：现将数据集D划分为k个大小相似的互斥子集。进行k次训练和测试，每次k-1个子集作为训练集，流出1个作为测试集。适用于数据集较大的情况。
自助法：自助从数据集D中有放回的随机采集m个样本构成D'，将D’用作训练集，D/D'用作测试集，这样的测试结果，称‘包外估计’。适用于数据集较小的情况。

4.调参与最终模型

大多数学习算法都有些参数需要设定，参数配置不同，学的模型的性能往往有显著差别。需要调参（对算法设定参数）

5.性能度量

对于学习器的泛化性能进行评估，衡量模型泛化能力的评价标准。

前面提到了错误率和精度,这是分类任务中最常用的两种性能度量。错误率是分类错误的样本书占样本总数的比例，精度则是分类正确的样本数占样本总数的比例。

混淆矩阵

这里又提了三个度量：查准率、查全率、F1

1）查准率：

2）查全率：

3）F1：是=

4）Fp

5）宏查全率、宏查准率、宏F1

6）微查准率、微查全率、微F1

ROC\AUC：

ROC：受试者工作特征（Receiver Operating Characteristic）

roc曲线的纵轴为“真正例率”，纵轴为“假正例率”，两者的定义

6. 代价敏感错误率与代价曲线

代价矩阵：cost01与cost10

ROC曲线不能反映出了，取而代之的是代价曲线：横轴是取值为（0,1）的正例概率代价，总之是取值为（0,1）的归一化代价

7.比较检验

这里用到了假设检验的知识。

8.偏差与方差

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【Machine learning】模型评估与选择（Model Evaluation and Selection）

我们该选择哪一个学习算法、使用哪一种参数配置，这就是机器学习中的模型选择问题。理想的解决方案是对候选模型的泛化误差进行评估，然后选择泛化误差最小的那个模型。但我们无法直接获得泛化误差，训练误差又由于过拟合现象的存在不适合作为标准，如何进行模型评估与选择？basic terms1.误差（训练误差和泛化误差）error（training error&amp;generalization err...
复制链接

扫一扫

专栏目录

潮汐止处 CSDN认证博客专家 CSDN认证企业博客

码龄9年

36: 原创

27万+: 周排名

68万+: 总排名

3万+: 访问

: 等级

754: 积分

5: 粉丝

11: 获赞

13: 评论

12: 收藏

私信

关注

热门文章

分类专栏

error edit 4篇
andriod环境配置 1篇
网站开发 2篇
python 3篇
算法组合优化 8篇
机器学习 6篇
git 2篇
面试 1篇
Java 5篇
数据库 3篇

最新评论

【mysql】The user specified as a definer ('gaozy'@'%') does not exist
CBeann: 不错，学习
【mysql】The user specified as a definer ('gaozy'@'%') does not exist
潮汐止处: ;)好久没写代码了...
【mysql】The user specified as a definer ('gaozy'@'%') does not exist
ctotalk: 不错，学习
【Machine learning】参数估计（个人通俗理解）
潮汐止处: 好久之前写的blog,我特喵的也快忘完了...晚点回复你
【Machine learning】参数估计（个人通俗理解）
lmw0320: 对参数估计这个概念，还是不能完全理解。这里所谓的参数，是指概率密度函数中的参数吧？那我如何假定涉及的概率分布是何种分布呢？正态分布，还是二项分布或是其他分布，是需要人为去假定的？假设这里是正态分布，那估计出来的参数，应该就是均值和方差，而如果是其他分布，那估计出来的参数，可能就是该分布对应的参数值？？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。