自适应学习率算法.基于阿米霍步长准则的线性回溯搜索算法

最新推荐文章于 2024-08-25 16:54:57 发布

张博208

最新推荐文章于 2024-08-25 16:54:57 发布

阅读量1.3k

点赞数

分类专栏： Algorithm Machine Learning Python

本文链接：https://blog.csdn.net/bbbeoy/article/details/73193067

版权

Machine Learning 同时被 3 个专栏收录

208 篇文章 14 订阅

订阅专栏

Python

158 篇文章 2 订阅

订阅专栏

Algorithm

51 篇文章 11 订阅

订阅专栏

解决在梯度下降等算法中，学习率步长的问题。

二分精确搜索法把梯度转化为和学习率的函数，问题转化为找学习率的问题，然后寻找梯度最低的时候的学习率是多少，在此过程中用了二分法查找学习率。是一种精确搜索方法

阿米霍步长准则是一个模糊搜索方法，梯度的变化满足一定的程度，不如此处梯度是9，设定系数0.3，下一点梯度为2.7

import numpy as np
def ArmijoBacktrack(fun,d,x,alpha,c=0.3):
    """

    :param fun: 目标函数，是个函数
    :param d: 当前点x处的导数，因为要寻找的是当前点处的最佳学习速率alpha，当前点的梯度是固定的，是个值，向量
    :param x: 当前点，向量
    :param alpha: 初始学习速率
    :param c: 参数c
    :return: 返回找到的学习速率
    """
    now=fun(x)
    nextv=fun(x-alpha*d)

    count=50
    while nextv < now and count>0:
        """
        寻找最大的alpha
        """
        alpha = alpha*2
        nextv=fun(x-alpha*d)
        count -=1

    iterstep=50
    slope=np.dot(d,d)
    while nextv > now - slope * c * alpha and iterstep>0:
        """
        折半搜索
        """
        alpha=alpha/2
        nextv=fun(x-alpha*d)
        iterstep-=1
    return alpha



def GradientDescent(fun,dfun,x,alpha,itersteps):
    for i in range(itersteps):
        d=dfun(x)
        x-= d * alpha
        print fun(x)

def ArmijoGradientDescent(fun,dfun,x,alpha,itersteps):
    for i in range(itersteps):
        d=dfun(x)
        alpha=ArmijoBacktrack(fun,d,x,alpha)
        x-=d*alpha
        print '{},{}'.format(alpha,fun(x))

def fun1(args):
    """
    x^2+y^4+z^6
    :param args:
    :return:
    """
    return args[0]**2+args[1]**4+args[2]**6

def dgfun1(args):
    """
    x^2+y^4+z^6
    :param args:
    :return:
    """
    return np.array([2*args[0],4*args[1]**3,6*args[2]**5])

if __name__=='__main__':
    args=np.array([3,2,2],dtype=float)


    # GradientDescent(fun1,dgfun1,args,0.01,1000)
    ArmijoGradientDescent(fun1,dgfun1,args,0.01,1000)

    # print fun1(args)
    # print 9+16+64
    # print dgfun1(args)
    #print ArmijoBacktrack(fun1,d,args,0.1)
    # ArmijoBacktrack(fun1,dgfun1,args,0.001)
    # GradientDescent(fun1,dgfun1,args,0.001,10000)

    # d=dgfun1(args)