1、含义 作用:是一个通过逐步逼近求局部最小值的方法 2、步长取值 步长太短:要花费很多步才能到达最低点,计算代价太大"is a baby step " 步长太长:很可能永远到达不了最低点 是一个逐步逼近的过程 因为 步长X偏导,越接近最低点,偏导越接近于0,所以后面参数会下降得越来越小