坐标轴下降 vs 梯度下降

梯度下降与坐标下降优化方法

梯度下降法

在每次迭代更新时选择负梯度方向(最速下降的方向)进行一次更新.不断迭代直至到达我们的目标或者满意为止.

坐标下降法

当损失函数不可导,梯度下降不再有效,可以使用坐标轴下降法,坐标下降法属于一种非梯度优化的方法,它在每步迭代中沿一个坐标的方向进行搜索,通过循环使用不同的坐标方法来达到目标函数的局部极小值。求导时只对一个维度(坐标轴方向)进行求导,而固定其它维度,这样每次只优化一个分量.假设有m个特征个数,坐标轴下降法进参数更新的时候,先固定m-1个值,然后再求另外一个的局部最优解,从而避免损失函数不可导问题
左梯度下降,右坐标轴下降
在这里插入图片描述
相比梯度下降法而言,坐标下降法不需要计算目标函数的梯度,标在每步迭代中仅需求解一维搜索问题,所以对于某些复杂的问题计算较为简便标。但如果目标函数不平滑的话,坐标下降法可能会陷入非驻点。为了加速收敛,可以采用一个适当的坐标系,例如通过主成分分析获得一个坐标间尽可能不相互关联的新坐标系
平滑与非平滑的函数示例如下图:
在这里插入图片描述
图中红色十字标示的是起始点(-0.5, -1.0),此时f =3.25。现在我们固定x,将f
看成关于y的一元二次方程并求当f最小时y的值:
在这里插入图片描述
即,现在自变量的取值就更新成了(-0.5, -0.3), f = 0.8。
在这里插入图片描述
下一步,将新得到的y值固定,将f看成关于x的一元二次方程。

注意事项

关于坐标下降法,有几点需要注意的:
1.坐标下降的顺序是任意的。
2.坐标下降的关键在于一次一个地更新,所有的一起更新有可能会导致不收敛。
3.坐标上升法和坐标下降法的本质一样,只不过目标函数成为求极大值了。

原文链接:
坐标下降 vs 梯度下降

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值