有关机器学习的小建议

最新推荐文章于 2023-08-01 23:16:32 发布

爱吃香菇的小姑娘

最新推荐文章于 2023-08-01 23:16:32 发布

阅读量247

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zwj256920/article/details/80671113

版权

机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

当你调试你的学习算法时，当面对测试集你的算法效果不佳时，你会怎么做？

使用更多的训练样本？
使用更少的特征集？
得到更多的其他特征？
尝试增加多项式的特征？
尝试增加拉姆他？
尝试减小拉姆他？

机器学习诊断法

我们通过将数据集分成训练集和测试集，将训练集训练出的参数用测试集数据测试性能。

常用的两种代价函数：

在多项式回归时，怎么选择次数作为我们的假设模型？

我们可以把数据集分为三类，训练集，交叉验证集和测试集，

用交叉验证集来作为评判选择的标准，选择合适的模型，而测试集则是作为算法性能的评判。

诊断高偏差和高方差

上面的图分别表示了高偏差，刚好，高方差

从图中可以看出，随着多项式次数的增大，训练集上的偏差逐渐变小，而交叉验证集上的偏差在减小到一定程度后开始升高。

正则化与偏差/方差

在加入正则化项后根据
λ的不同所得图如下

学习曲线

根据样本的大小与误差的关系我们可以画出一般的学习曲线：

在高偏差的情况下，随着样本数目的增大，训练集上的误差和交叉验证集上的误差逐渐逼近。
这里写图片描述

也就是说，增大样本的方法对高偏差的模型并不能起到一定作用

而模型处于高方差的情况下，增大样本可能会起到效果。

这里写图片描述

对开头提出的各种措施，我们看看他们适合于什么样的模型：

爱吃香菇的小姑娘

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
有关机器学习的小建议

当你调试你的学习算法时，当面对测试集你的算法效果不佳时，你会怎么做？使用更多的训练样本？使用更少的特征集？得到更多的其他特征？尝试增加多项式的特征？尝试增加拉姆他？尝试减小拉姆他？机器学习诊断法我们通过将数据集分成训练集和测试集，将训练集训练出的参数用测试集数据测试性能。常用的两种代价函数：在多项式回归时，怎...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。