1.影响模型的因素
training set个数
特征个数
lambda取值
阶数选择
2.模型诊断
取60%作为trainging set,20%作为cross validation,20%作为test set
用training set拟合出的theta,计算J_cv
J_cv和J差不多时,拟合合适
J很小,J_cv很大时过度拟合
J和J_cv差不多且都很大时拟合不足
3.lambda选择
J随lambda增大而增大
J_cv先减小后增加
J和J_cv差不多且都很大时拟合不足
J很小,J_cv很大时过度拟合