learning rate

最新推荐文章于 2024-06-26 08:40:23 发布

tdinzju

最新推荐文章于 2024-06-26 08:40:23 发布

阅读量728

点赞数

1.learning rate 是调参的重要一项。过大，会造成跳过了极值点、找不到极值点、在极值点附近徘徊。以y=x^2，x=5为例，learning rate 设为1，则无论多少轮迭代，值都不会下降。一直在x=5,-5徘徊。而learning rate 过小效率极低。收敛时间过长。

2.tf提供tf.train.expontntial_decay(lr,global_step,epoch_size,decay_rate,staircase)可以指数级减小学习率。 lr=lr*decay_rate^(global/epoch_size)

3.另一个技巧是，在每次迭代的最后，使用估计的模型参数检查误差函数（error function）的值。如果相对于上一次迭代，错误率减少了，就可以增大学习率，以5%的幅度；如果相对于上一次迭代，错误率增大了（意味着跳过了最优值），那么应该重新设置上一轮迭代ωj 的值，并且减少学习率到之前的50%。http://www.willamette.edu/~gorr/classes/cs449/momrate.html有相关介绍

从文件读学习率模块：

def get_learning_rate_from_file(filename, epoch):#设置学习率方法
    with open(filename, 'r') as f:
        for line in f.readlines():
            line = line.split('#', 1)[0]
            if line:
                par = line.strip().split(':')
                e = int(par[0])
                lr = float(par[1])
                if e <= epoch:
                    learning_rate = lr
                else:
                    return learning_rate