接下来介绍一些比梯度下降法计算速度更快的优化算法。
2.3 指数加权平均
为了更好地介绍这些优化算法,这里先介绍一个概念----指数加权平均(exponentially weighted averages),全称为指数加权移动平均(exponentially weighted moving averages)。
下图展示的是伦敦一年温度的例子,散点图如下图所示。
对该数据拟合曲线,假设V0=0,而估计每一天的温度(Vt)等于前一天的温度(Vt-1)和当天温度()的加权平均,为什么说是指数加权平均呢?这是因为通过展开,把每一项都用V0和实际温度表示,会发现,上例中=0.9,再加上初始值为0的假设,则第t天的温度就是前t天真实温度的指数加权平均。根据这个方法,拟合出来的曲线如图中红线所示。
其实,近似等于前天真实温度的平均值,比如在上例中,