首先补充一些铺垫知识
无偏估计
百度百科:无偏估计是用样本统计量来估计总体参数时的一种无偏推断。估计量的数学期望等于被估计参数的真实值,则称此估计量为被估计参数的无偏估计,即具有无偏性,是一种用于评价估计量优良性的准则。
简单来说,就是对总体样本进行多次采样,求出每次采样的样本均值,根据中心极限定理,这些多次取样的样本均值应该是服从正态分布的,求出这个分布的期望,这个期望等于总体样本的期望,那么这个估计就具有无偏性,就是一种无偏估计,这恰恰是构建回归算法(可以看这篇)的假设函数的基本思想。首先确定数据集中target的分布,然后求出这个分布的期望,这个期望这个数据集的无偏估计,因此令这个分布的期望作为假设函数,以估计真实的函数。
L2正则化
L2正则化就是在原来的损失函数的基础上加上权重的平方和:
接下来解释为什么要这样做,正则化的目的是约束权重不能过多或过大,这样会使模型变的复杂,从而有可能导致过拟合。因此我们就在末尾加上了一