集成学习(上)——优化基础模型

最新推荐文章于 2024-07-11 09:51:27 发布

一只元气满满鸭

最新推荐文章于 2024-07-11 09:51:27 发布

阅读量309

点赞数

分类专栏： Datawhale 文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/suandyanr/article/details/115097523

版权

Datawhale 集成学习（上）—— 优化基础模型

文章目录

前言
一、训练和测试的均方误差
二、偏差-方差权衡
三、正则化
- 1、岭回归（L2正则化）
- 2、Lasso回归（L1正则化）

前言

本节主要针对的是模型在训练集和测试集上表现差异的问题，建立的机器学习的模型不是为了在已有的数据上表现良好，而是为了在未知的数据上也有出色的表现

一、训练和测试的均方误差

$\frac{1}{N}\sum\limits_{i = 1}^N { { {({y_i} - \widehat f({x_i}))}^2}}$
如果使用训练集计算的均方误差就是，训练均方误差；
如果使用测试集计算的均方误差就是，测试均方误差；
但是我们在训练模型的时候，是没有测试集的，我们能够计算就只有训练均方误差。那么我们以训练均方误差作为标准，在训练的过程中，使得训练均方误差逐步减小，是否训练出来的模型在测试集上也拥有这么小的均方误差呢？
在这里插入图片描述
从图中可以看出：在左边的图中，绿色的线相较于其他颜色的线，貌似拟合的要好一点。但是根据右边的图可以知道，绿色的拟合模型在测试集上的测试均方误差是最大的，说明绿色的拟合模型出现了过拟合的情况。所以，模型在训练误差很小，但是测试均方误差很大时，我们称这种情况叫模型的过拟合。
那么如何解决模型过拟合的问题呢？

二、偏差-方差权衡

$E{({y_i} - \widehat f({x_i}))^2} = Var(\widehat f({x_0})) + {[Bias(\widehat f({x_0}))]^2} + Var(\varepsilon )$

最低0.47元/天解锁文章

一只元气满满鸭

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
集成学习(上)——优化基础模型

Datawhale 集成学习（上）—— 优化基础模型文章目录前言一、训练和测试的均方误差二、偏差-方差权衡1. 训练误差修正2、交叉验证3、特征提取三、正则化1、岭回归（L2正则化）2、Lasso回归（L1正则化）前言本节主要针对的是模型在训练集和测试集上表现差异的问题，建立的机器学习的模型不是为了在已有的数据上表现良好，而是为了在未知的数据上也有出色的表现一、训练和测试的均方误差MSE=1N∑i=1N(yi−f^(xi))2MSE = \frac{1}{N}\sum\limits_{i =
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。