梯度下降向量化推导
再看了一篇博客后,了解了梯度下降向量化的推导公式,所以便写篇博客记录一下,加深一些记忆。
首先,对于输入矩阵X为m*n的矩阵
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190406114958998.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQxNjcwNDY2,size_16,color_FFFFFF,t_70)
所以预测值为 y ^ \widehat{y} y
:
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190406115021539.png)
MSE= 1 2 ∗ ( y ^ − y ) 2 = 1 2 ( X ω − y ) 2 \frac{1}{2} *(\widehat{y}-y)^2=\frac{1}{2}(X\omega-y)^2 21∗(y
−y)2=21(Xω−y)2
接下来对式子进行化简
首先
X T X = ∑ X i j 2 X^T X=\sum X_{ij}^2 XTX=∑X