- 梯度下降法 Gradient descent
作用: 用来最小化函数,这里用来最小化代价函数。
做法是:给定a,b最初值,一般起初都为0,然后不停的一点点(在图像上表示即是360度环绕四周,我下一步要怎么走才能最快下降到山底)的改变a,b来使得代价函数变小,直到找到代价函数的最小值或者局部最小值。从而也就确定了a,b的值
梯度下降法的特点:最初点选择不同会得到一个不同的最优解。
简化研究:假设只有一个参数如下图
如果梯度下降已经到达了一个局部最优解,那么下一步梯度下降会怎么样?
答:参数将不再改变,如下图解释
- 常存在局部最优解的问题,选择不同的初始值,最