机器学习中误差的来源主要有两个方面:Bias(偏差) 和 Variance(方差)。只有找到误差的来源,才能为下一步的模型优化提供方向。 1. Bias 和 Variance 这里以估计随机变量 X 的均值和方差为例,进行分析。假设,对于随机变量 X: X 的均值是 ? X 的方差是 ?2 1.1 首先考虑均值 我们在总体中取出 N 个样本 {X1, X2, …, XN},对随机变量 X 的均值作估计: m = 1 N ∑ X n \frac{1}{N}\sum_{}^{}X^n N1∑Xn ≠