【扫盲】机器学习中模型的容量、表示容量、有效容量

        我们训练机器学习模型时,可以选择训练集来拟合目标函数,降低训练误差,并缩小训练误差和测试误差的差距(欠拟合和过拟合)。

        模型的容量(capacity)从本质上说是描述了整个模型的拟合能力的大小。容量低的模型可能在训练集上就会很难拟合目标函数,产生而欠拟合;容量高的模型或许会在训练集上可以很好的拟合目标函数,而不具备一定的泛化能力,导致过拟合。

增加模型容量的方法有很多,比如我们使用线性回归函数来拟合一个线性函数,就可以通过增加参数高次幂的方法来增加模型容量,一个5次多项式(包含从1到5次幂以及常数项)的模型就比二次多项式的模型容量要高。但是如果我们要拟合的是一个三次函数,用二次多项式的模型就会导致欠拟合,用5次多项式就可能会导致过拟合。

        表示容量(representational capacity):模型的最大容量。指的是通过调节参数降低训练目标时,学习算法可以从哪些函数族中选择函数。

        有效容量(effective capacity)​​​​:在实际训练机器学习模型中,从表示容量中选择最优函数是非常困难的,比如我们要拟合一个三次函数,而我们选择的容量中可能包括四次多项式,其实有效容量里是没有四次幂的。实际上我们训练出来的模型只是一个可以大大降低训练误差的函数,并不可能完美,也就说学习算法的有效容量,可能会小于模型的表示容量

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值