这本书里之所以用的是梯度上升,原因和前面几位楼主说的一样,是因为这本书里用的差距是y-θ(xw+b),而梯度下降法用的是θ(xw+b)-y,所以要变换符号。
https://www.zhihu.com/question/24658302/answer/73430764
这本书里之所以用的是梯度上升,原因和前面几位楼主说的一样,是因为这本书里用的差距是y-θ(xw+b),而梯度下降法用的是θ(xw+b)-y,所以要变换符号。
https://www.zhihu.com/question/24658302/answer/73430764