如何选择合适的模型?

最新推荐文章于 2024-01-10 01:46:47 发布

Mae_strive

最新推荐文章于 2024-01-10 01:46:47 发布

阅读量1.6k

点赞数

文章标签：深度学习机器学习模型选择算法 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_51799151/article/details/123620525

版权

人工智能+大数据专栏收录该内容

26 篇文章 64 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

文章目录

模型选择

模型选择

模型能力强的复杂度高，容易导致过拟合。
模型能力弱，又容易导致欠拟合。

1、引入验证集

将训练集分为两部分。训练集和验证集
但需遵循：

训练集中样本数量必须足够多，一般至少大于总样本数的一半
两组数据集必须从完整数据集中均匀取样，减少偏差。

验证集其实就是对模型的能力进行初步的评估。

交叉验证

如果我们数据本身就有限，将数据分为训练集和验证集导致数据稀疏问题。
为了解决这个问题，所以我们使用交叉验证方法。
交叉验证：
将训练集分为S组，每次取S-1组作为训练集，剩下的一组作为验证集。
取验证集中平均性能最好的一组模型。

2、模型选择准则

AIC(赤池信息准则)

公式：
在这里插入图片描述
其中k为模型参数个数，n为样本数量，L为似然函数。训练模型时，增加参数数量，也就是增加模型复杂度，会增大似然函数，但是也会导致过拟合现象。kln(n)惩罚项在样本数量较多的情况下可有效防止模型精度过高造成模型复杂度过高的问

了解本专栏

超级会员免费看

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
如何选择合适的模型?

文章目录模型选择1、引入验证集交叉验证2、模型选择准则AIC(赤池信息准则)BIC(贝叶斯信息准则)模型选择模型能力强的复杂度高，容易导致过拟合。模型能力弱，又容易导致欠拟合。1、引入验证集将训练集分为两部分。训练集和验证集但需遵循：训练集中样本数量必须足够多，一般至少大于总样本数的一半两组数据集必须从完整数据集中均匀取样，减少偏差。验证集其实就是对模型的能力进行初步的评估。交叉验证如果我们数据本身就有限，将数据分为训练集和验证集导致数据稀疏问题。为了解决这个问题，所以我们使用交
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Mae_strive 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。