梯度下降算法

此为转载文章,虽然算法的讲解不是很详细和明了,但是通过自己的理解和琢磨,也很大程度地帮助了我理解了SGD,所以还是值得转的


1.当然求最小值就是梯度下降,而求最大值相对就是梯度上升。


2.由于,如果,那么得到

 

             

 

现在我们要找一组,使得所有的最接近,设

 

           

 

现在我们要找一组,使得最小。这就是今天要介绍的梯度下降。

 

梯度下降的原理是这样的:首先对于向量赋初值,可以赋随机值,也可以全赋为0,然后改变的值,使得

按梯度下降最快的方向进行,一直迭代下去最终会得到局部最小值。

 

                                

 

表示梯度最陡的那个方向,表示步长,也就是说每次向下降最快的方向走多远。进一步有

 

         

 

所以

          

 

简化一下就是

 

            

 

随机梯度下降算法


http://blog.csdn.net/lilyth_lilyth/article/details/8973972

这篇文章简单介绍和比较了批量梯度下降和随机梯度下降,可以看看

    评论
    添加红包

    请填写红包祝福语或标题

    红包个数最小为10个

    红包金额最低5元

    当前余额3.43前往充值 >
    需支付:10.00
    成就一亿技术人!
    领取后你会自动成为博主和红包主的粉丝 规则
    hope_wisdom
    发出的红包
    实付
    使用余额支付
    点击重新获取
    扫码支付
    钱包余额 0

    抵扣说明:

    1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
    2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

    余额充值