机器学习算法笔记-评价

diudiu~bo

于 2021-08-25 20:21:06 发布

阅读量256

点赞数

分类专栏：机器学习经典算法文章标签：算法 sklearn 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39835296/article/details/119916380

版权

评价方法

交叉验证集
混淆矩阵（confusion matrix）
评价指标
阈值对结果的影响

交叉验证集

平时我们常用的是把数据集分成训练集和测试集，但是每训练一次就用测试集测试一次，如果测试结果不好还要再训练，这样就比较麻烦，因此就要用到交叉验证集了，那么什么是交叉验证集呢？
如下图，把原来的训练集分出一小部分作为验证集，在验证时使用训练集和验证集中的所有数据，那么这两部分数据集组合在一起就叫交叉验证集。
我的理解是，训练集的精度高，代表训练的偏差小，验证集的精度高，说明方差小，也就是鲁棒性好。一般来说我们肯定希望偏差还方差都小，但是方差和偏差的变化是一个反向关系，偏差小了，方差就大了，就好像训练函数是专门为当前训练集定制的，换一份不同的训练集效果就会变差，甚至很差，也就是常说的过拟合问题。反之，如果方差小了，偏差就会增大，当方差很小，偏差很大时，就是欠拟合的想象。为此需要在这两者之间找到一个平衡，这也是交叉验证集的意义所在，他的结果既反应了偏差，又反映了方差，这是测试集所不能做到的。
在这里插入图片描述
转自：https://www.bilibili.com/video/BV1rq4y1p7nJ?p=21
那么划分训练集和验证集如何划分呢？如下图，可以把交叉验证集划分成n份，选择其中的一份作为验证集。
因为交叉验证集的作用主要是用来调参的，所以测试一次、调整一次、训练一次很繁琐，此时可以中sklea

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习算法笔记-评价

评价方法交叉验证集混淆矩阵（confusion matrix）评价指标阈值对结果的影响交叉验证集平时我们常用的是把数据集分成训练集和测试集，但是每训练一次就用测试集测试一次，如果测试结果不好还要再训练，这样就比较麻烦，因此就要用到交叉验证集了，那么什么是交叉验证集呢？如下图，把原来的训练集分出一小部分作为验证集，在验证时使用训练集和验证集中的所有数据，那么这两部分数据集组合在一起就叫交叉验证集。我的理解是，训练集的精度高，代表训练的偏差小，验证集的精度高，说明方差小，也就是鲁棒性好。一般来说我们肯定
复制链接

扫一扫

专栏目录

diudiu~bo CSDN认证博客专家 CSDN认证企业博客

码龄7年

23: 原创

54万+: 周排名

105万+: 总排名

3万+: 访问

: 等级

274: 积分

14: 粉丝

29: 获赞

9: 评论

165: 收藏

私信

关注

热门文章

分类专栏

机器学习经典算法 7篇
pytorch 学习 6篇

最新评论

粘连目标的分离方法
OpenCv机器视觉: 文章写得很好，我也写了一篇类似得，欢迎大家得访问，一起进步！https://blog.csdn.net/DGWY161744/article/details/129936960
粘连目标的分离方法
t不以物喜不以己悲c: 博主你好，遥感影像里的耕地地块也存在粘接，但分水岭算法很难去掉粘接。你认为这篇博文的方法能有效去粘接吗？
修改github上的SSD代码在本地运行
梨花儿: 想请问一下，改了这些改动，但是运行时loss一直时inf一般是什么问题呢？
粘连目标的分离方法
diudiu~bo: 不好意思，很久没来CSDN了，发现很多人都对这个方法挺感兴趣。因为后来做了别的内容所以没有继续这篇文章。等我有时间了写一写，没能帮上忙非常抱歉。
修改github上的SSD代码在本地运行
diudiu~bo: 我也只是小白，按理说只是调试到本地的话不应该差这么多，你是下载的最原始的模型和数据集吗，是不是被调试改动过啊

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。