第二章模型评估与选择

最新推荐文章于 2023-05-01 01:25:40 发布

遨游的菜鸡

最新推荐文章于 2023-05-01 01:25:40 发布

阅读量176

点赞数 2

分类专栏：机器学习周志华(西瓜书)

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34405401/article/details/104847373

版权

本文详细探讨了模型评估与选择的方法，包括分层采样、留一法、交叉验证、混淆矩阵、查准率与查全率、ROC曲线、错误率以及特征规范化。文章深入讲解了ROC曲线不应存在斜线的原因，并介绍了Min-max和z-score两种规范化方法及其优缺点。此外，提到了McNemar检验在比较分类模型性能中的应用。

摘要由CSDN通过智能技术生成

题

在这里插入图片描述

2.1

采样角度：
采用分层采样，因此要保证训练集里有350个正例、350个反例，测试集里有150个正例，150个反例

划分方式角度：
具体划分数值已确定（70%训练，30%测试），那么就开始从500个正例中挑350个放入训练集，500个反例中挑350个放入训练集，剩下的放入测试集。

挑哪些放入训练集就是数学的组合问题：
正反例都要挑，因此结果为 $C_{500}^{150}$

最低0.47元/天解锁文章

遨游的菜鸡

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
第二章模型评估与选择

题2.1采样角度：采用分层采样，因此要保证训练集里有350个正例、350个反例，测试集里有150个正例，150个反例划分方式角度：具体划分数值已确定（70%训练，30%测试），那么就开始从500个正例中挑350个放入训练集，500个反例中挑350个放入训练集，剩下的放入测试集。挑哪些放入训练集就是数学的组合问题：正反例都要挑，因此结果为 C500150C_{500}^{150}C5...
复制链接

扫一扫

专栏目录

遨游的菜鸡 CSDN认证博客专家 CSDN认证企业博客

码龄8年

154: 原创

23万+: 周排名

115万+: 总排名

23万+: 访问

: 等级

2626: 积分

81: 粉丝

153: 获赞

37: 评论

748: 收藏

私信

关注

热门文章

分类专栏

python 26篇
深度学习 7篇
MySQL 4篇
paper 6篇
主动学习 4篇
pytorch 14篇
杂记 16篇
机器学习 7篇
算法与数据结构 9篇
项目实训 9篇
c++ 9篇
机器学习周志华(西瓜书) 11篇
前端 4篇
requests 5篇
scrapy 5篇
CS224N NLP 5篇
统计学习方法 11篇
tensorflow 12篇
kaggle 2篇

最新评论

解决深度学习PyTorch，TensorFlow中GPU、CPU利用率较低的问题
Tengfei Wang: 我们两个的GPU加速明显能对比出差距，我的慢很多
解决深度学习PyTorch，TensorFlow中GPU、CPU利用率较低的问题
Tengfei Wang: 而且我们的深度学习环境也都是一样的，cuda、cudnn、torch等环境都完全一样，为什么会出现了利用率一个为0一个为100%的两种情况呢？
解决深度学习PyTorch，TensorFlow中GPU、CPU利用率较低的问题
Tengfei Wang: 同样的模型，同样的电脑配置，同样的显卡驱动，为什么我的显卡利用率一直是0，显存能吃满，而别人的利用率一直是100%？
主动学习框架
境界面上的双曲线: 博主，我想请问一下，如果我们自己建立一个深度学习模型与主动学习器结合，在不断往训练集里面加新的数据的过程中，我们如何才能知道自己的深度学习模型里的参数才是最优的呢？因为单独使用深度学习的时候，我们会多次训练调参以尽量达到最优参数，但是与主动学习结合加新数据的过程中，我们并不知道自己的模型参数是不是最优的，如果在不断加新数据的过程中调参数的话，感觉前后查询数据的模型就变了（相同模型不同参数）
主动学习框架
境界面上的双曲线: 请问一下你知道结果了吗？回归模型是不是这些查询策略都不适用啊？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。