误差的来源
Bias + Variance
模型最理想状态是没有bias,而且Variance 很小
Variance 方差
简单的模型的variance 就偏小。
模型越简单,特征越少,所以受数据的方法影响越小
Bias
数据集的均值和测试集的均值的欧式距离就是Bias的大小
模型越复杂,特征越多,Bias 越小
Bias 和 Variance 造成了过拟合和和欠你和。Bias 大就是欠拟合,Variance 就是过拟合
判断过拟合或者欠拟合的方法
方差大 加数据,正则化,流型,PCA
Bias大 加特征
模型选择
交叉验证
梯度下降 Gradient Descent
L loss function