过拟合及改善方法

本文总结了深度学习中过拟合的概念及其原因,包括训练样本过少和模型过于复杂。提出改善过拟合的方法,如数据扩增、正则化、Dropout策略以及交叉验证。这些方法能有效提高模型对测试数据的泛化能力。
摘要由CSDN通过智能技术生成

最近在学习深度学习相关内容,关于机器学习中过拟合的几种方法进行总结。

首先什么是过拟合,简而言之就是训练成功的模型对于训练集具有非常好的一个预测能力,但是对于测试集的数据其预测能力往往差强人意。

可以用以下几幅图比较形象地解释:


上图中的小圆点的待拟合的数据点,我们用M次多项式进行拟合的过程中,M值越大,用于拟合的参数越多

显然M=0时候,相当于y=c0,参数只有一个c0,是一条平行于x轴的直线;

M=1的时候, y=c1*x+c0,两个参数c1,c0,是一条直线;

M=1的时候, y=c2*x*x+c1*x+c0,有三个参数c2,c1,c0,拟合效果比较好;

同理,当M=9时候,有9个参数,此时生成的曲线经过了每一个样本点,但是,训练误差是0,就从训练数据拟合的角度来说,效果是最好的,但是这种训练结果对于测试数据的拟合效果将非常差,这时候就出现了过拟合,所以在模型或者参数选择的时候,不仅要考虑训练数据,还要考虑测试数据。

发生过

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值