机器学习算法的性能评估常用的几种方式

1.获取更多的样本
2.减少或增加特征量
3.减少或增加lamda的值
在这里插入图片描述
现在来说如何找到有效的方法使训练集的偏差变小。

一.通常把训练样本分为训练集(60%),交叉验证集(20%),测试集(20%)。
训练集:找到对应拟合的θ
验证集:在训练集应用找到的θ后计算出验证误差(最后一般选验证误差较小的参数作为假设参数)
测试集:对测试集所有的误差进行平均加权,得到测试误差。
在这里插入图片描述
二.选择合适的模型。
在选择模型时,如果维度很大会照成数据的过拟合现象。如果维度较小又会找出数据拟合的不够。
首先在测试数据之前选择多种模型,对每一种模型求出对应的θ,计算验证误差,选取验证误差最小的θ的模型作为数据的拟合模型。在这里插入图片描述
假设第四个模型的验证误差最小,我们就选择第四种模型。
三.选取适当的参数lamda。
在这里插入图片描述
当数据欠拟合时这时叫做高偏差,过拟合时称为高方差。选取合适的lamba,得到刚刚好的拟合数据。
假设我们有了合适的模型,来选择lamda。
在这里插入图片描述
由代价函数看出 当lamda过大时对θ的惩罚会很大 θ趋近于0
当lamda过小时会发生欠拟合现象,同样的去尝试lamda
在这里插入图片描述
选择验证误差最小的lamda。
4.画出学习曲线
横坐标样本量,纵坐标误差值,函数Jcv验证误差 ,函数Jtrain验证误差。
如果数据有很高的方差在这里插入图片描述,训练误差在增大样本时,仍保持一个近乎水平的线如下图:
如果数据有偏差在这里插入图片描述
训练误差和验证误差的间隙会很大。
当出现这两种情况时,就需要调整合适的模型和参数了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值