分享创新知识、改变世界!
更新:2022.6.24【1】--2023.12.15【2】
傅里叶变换、拉普拉斯变换、Z 变换的联系是什么?为什么要进行这些变换?
正定矩阵与半正定矩阵定义性质与理解+半正定矩阵和正定矩阵的一些理解和补充
不管是求解优化目标还是为了调参,只要问题从理论层面上升到实际操作层面,就离不开优化算法。主讲梯度下降(Gradient Descent)算法。
动量法(Momentum)
普通的梯度下降法解决常规问题,如线性回归,但当问题变复杂,普通的梯度下降法就会面临很多局限。当接近最优值时梯度会比较小,由于学习率固定,普通的梯度下降法的收敛速度会变慢,有时甚至陷入局部最优。这时如果考虑历史梯度,将会引导参数朝着最优值更快收敛,这就是动量算法的基本思想。