Stanford 机器学习-Advice for Applying Machine Learing

Deciding What to Try Next

当用算法实现预测功能但是效果不是很好时的解决办法如下:
这里写图片描述

Evaluating a Hypothesis

线性回归计算J( θ )的公式
这里写图片描述
逻辑回归分类时计算J( θ )的公式,以及error计算公式
这里写图片描述

Model Selection and Train_Validation_Test Sets

将所有数据按%60,%20,%20分为training set , cross validation set , testing set三类,以及三种误差。
这里写图片描述
这里写图片描述
traning set用于训练
cross validation set用于选择模型
testing set用于评估
这里写图片描述

Diagnosing Bias vs. Variance

  1. Bias Error: bias error是指模型预测值与真实值差异的平均值。假如有m个样本,1每次随机去n个(n << m),用n个样本训练出一个模型。然后对(x,y)进行预测得到一个预测值y(1);重复1操作,然后对(x,y)进行预测得到y(2).Error due to Bias = (y(1) – y + y(2) – y, 然后求平均)。
  2. Variance Error: Variance Error是指每次预测的方差,反应模型预测的波动情况。
  3. 区别:Bias反映的是模型在样本上的输出与真实值之间的误差,即模型本身的精准度,Variance反映的是模型每一次输出结果与模型输出期望之间的误差,即模型的稳定性。
    这里写图片描述
    这里写图片描述

Regularization and Bias_Variance

这里写图片描述
在选取 λ ,依次测试多个 λ 值,选取使得 Jθ 最小的 λ
这里写图片描述
这里写图片描述

Learning Curves

理想情况下的学习曲线应该是随着m的增加, Jtrain(θ) and Jcv(θ) 都会随之减少,并处于相对低的一个值。
这里写图片描述
high bias情况下,表示underfit,此时 Jtrain(θ) and Jcv(θ) 都会随之减少,但二者的值都会比较大。
这里写图片描述
high variance,表示overfit,二者之间会有较大的gap
这里写图片描述

Deciding What to Do Next Revisited

各种解决办法适用的情况。
这里写图片描述
一般来说 使用一个大型的神经网络并使用正则化来修正过拟合问题通常比使用一个小型的神经网络效果更好。
这里写图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值