机器学习的模型评估方法

最新推荐文章于 2021-11-22 15:39:53 发布

置顶

KobeLovesDawn

最新推荐文章于 2021-11-22 15:39:53 发布

阅读量847

点赞数 1

分类专栏：机器学习文章标签：机器学习模型评估人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/KobeLovesDawn/article/details/86433817

版权

本文介绍了机器学习中常用的模型评估方法，包括留出法、交叉验证法和自助法。留出法简单但结果可能不稳定；交叉验证法通过平均结果提高稳定性，但训练数据减少；自助法能解决数据量少的问题，但改变了数据分布。最终模型选择在验证集中表现最佳的模型，并使用全部数据重新训练。

摘要由CSDN通过智能技术生成

机器学习的模型评估就是对数据集D进行适当的处理，得到训练集S和测试集T，并在T中对模型进行验证，得到模型的好坏，下面是几种常用的方法：

留出法(hold-out)

“留出法”就是将数据集分为两个互斥的集合，一个作为训练集S，另一个作为测试集T，有D = S $\bigcup$ T，S $\bigcap$ T = $\emptyset$
其中，训练集S用来训练模型，测试集T用于评估模型的误差或精度，即模型的好坏
一般而言，训练集S的比例占数据集D的 $\frac{2}{3}$ ~ $\frac{4}{5}$
对数据集D划分时，S与T中数据的分布必须与原数据一致，举例来说，如猫狗二分类的任务，若数据集D中猫狗的比例是7 : 3，则在S和T中，猫狗的比例也应该是7 : 3
“留出法”较为简单，但存在一些缺陷，主要有两个，一是留出法的验证结果与数据集的划分有关，不同的划分可能会导致不同的误差，导致结果不稳定；另一方面，留出法必须留出一部分数据用于验证，使得训练模型用的数据少于原数据集D，因而可能训练不够充分
对于第一个缺陷，可以用下面的“交叉验证法”解决；对于第二个缺陷，可以用下面的“自助法”解决

交叉验证法(cross validation)

“交叉验证法”是将原数据集D划分成k个不相交且大小相同的集合，且每个集合与原数据集同分布，即 $S_1 \bigcup S_2$

最低0.47元/天解锁文章

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

KobeLovesDawn CSDN认证博客专家 CSDN认证企业博客

码龄7年

3: 原创

53万+: 周排名

106万+: 总排名

1万+: 访问

: 等级

182: 积分

22: 粉丝

24: 获赞

7: 评论

154: 收藏

私信

关注

热门文章

分类专栏

机器学习 2篇
计算机视觉 1篇

最新评论

计算机视觉入门--图像分类简介及算法
xian4105: 博主的循序渐进正是我一直在找的文章，太感谢了，催更！
计算机视觉入门--图像分类简介及算法
KobeLovesDawn 回复 nanfangyuanyuan: 网络会尝试学习有判别性的区域，可以参考一下"Learning Deep Features for Discriminative Localization".
计算机视觉入门--图像分类简介及算法
nanfangyuanyuan: 楼主图像分类关键点在什么呀？原图特征吗？语义特征？哪里才是关键可以区分类别的像素点？特征点？求楼主分享啊
机器学习模型的性能度量
James_probie: 好厉害
机器学习模型的性能度量
James_probie: 谢谢博主分享

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。