通过偏差/方差大小判断模型

本文介绍了如何通过偏差/方差分析来评估机器学习模型的性能,提供了解决高偏差和高方差的方法,如调整特征数量、正则化程度,并详细阐述了模型选择过程,包括使用训练集、测试集和交叉验证集进行模型选择和正则化参数λ的选择。学习曲线被用来在过拟合和欠拟合情况下指导更多数据的引入以提升算法效果。
摘要由CSDN通过智能技术生成
  1. 获得更多的训练实例——通常是有效的,但代价较大,下面的方法也可能有效,可
    考虑先采用下面的几种方法。————解决高方差
  2. 尝试减少特征的数量 ————解决高方差
  3. 尝试获得更多的特征 ————解决高偏差
  4. 尝试增加多项式特征 ————解决高偏差
  5. 尝试减少正则化程度λ ———解决高偏差
  6. 尝试增加正则化程度λ ———解决高方差

绍怎样评估机器学习算法的性能???
“机器学习诊断法”

判断是否过拟合:们将数据分成训练集和测试集,通常用 70%的数据作为训练集,用剩下 30%的数据作为测试集。很重要的一点是训练集和测试集均要含有各种类型的数据,通常我们要对数据进行“洗牌”,然后再分成训练集和测试集

  1. 对于线性回归模型,我们利用测试集数据计算代价函数 J
  2. 对于逻辑回归模型,我们除了可以利用测试数据集来计算代价函数外:

误分类的比率,对于每一个测试集实例,计算:

然后对计算结果求平均

模型选择和交叉验证集:

60%数据作为训练集,20%数据作为交叉验证集,20%作为测试集。
模型选择方法:
1 使用训练集训练出10个模型
2 用10个模型分别对交叉验证集计算得出交叉验证误差(代价函数的值)
3 选取代价函数最小的模型
4 用3选出的模型对测试集计算得出推广误差(代价函数的值)

如果算法表现不理想,主要是两种情况:1)偏差比较大,high bias——欠拟合;2)方差比较大,high variance—

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值