用卷积神经网络检测脸部关键点的教程（三）学习率，学习动量，dropout

最新推荐文章于 2024-05-24 16:52:14 发布

SuPhoebe

最新推荐文章于 2024-05-24 16:52:14 发布

阅读量3.7k

点赞数

分类专栏：机器学习 & 深度学习机器学习与数学模型文章标签：神经网络 Lasagne

本文翻译自Using convolutional neural nets to detect facial keypoints tutorial。

用卷积神经网络检测脸部关键点的教程（一）环境配置与浅层网络训练
 用卷积神经网络检测脸部关键点的教程（二）卷积神经网络训练和数据扩充
 用卷积神经网络检测脸部关键点的教程（三）学习率，学习动量，dropout
用卷积神经网络检测脸部关键点的教程（四）通过前训练（pre-train）训练专项网络

上个模型令人讨厌的地方是光训练就花了一个小时的时间，等结果并不是一个令人心情愉快的事情。这一部分，我们将讨论将两个技巧结合让网络训练的更快！

直觉上的解决办法是，开始训练时取一个较高的学习率，随着迭代次数的增多不停的减小这个值。这是有道理的，因为开始的时候我们距离全局最优点非常远，我们想要朝着最优点的方向大步前进；然而里最优点越近，我们就前进的越谨慎，以免一步跨过去。举个例子说就是你乘火车回家，但你进家门的时候肯定是走进去，不能让火车开进去。

关于深度学习中的初始化和动量的重要性是Ilya Sutskever等人的谈话和论文的标题。在那里，我们学习了另一个有用的技巧来促进深度学习：即在训练期间增加优化方法的动量参数。

在我们以前的模型中，我们将学习率和学习势初始化为静态的0.01和0.9。让我们来改变这两个参数，使得学习率随着迭代次数线性减小，同时让学习动量增大。

NeuralNet允许我们在训练时通过on_epoch_finished函数来更新参数。于是我们传一个函数给on_epoch_finished，使得这个函数在每次迭代之后被调用。然而，在我们改变学习率和学习势这两个参数之前，我们必须将这两个参数改变为Theano shared variables。好在这非常简单。

import theano

def float32(k):
    return np.cast['float32'](k)

net4 = NeuralNet(
    # ...
    update_learning_rate=theano.shared(float32(0.03)),
    update_momentum=theano.shared(float32(0.9)),
    # ...
    )

我们传递的回调函数或者回调列表在调用时需要两个参数：nn，它是NeuralNet的实例；train_history，它和nn.history是同一个值。

不使用硬编码值的毁掉函数，我们将使用一个可参数化的类，在其中定义一个call函数来作为我们的回调函数。让我们把这个类叫做AdjustVariable，实现是相当简单的：

class AdjustVariable(object):
    def __init__(self, name, start=0.03, stop=0.001):
        self.name = name
        self.start, self.stop = start, stop
        self.ls = None

    def __call__(self, nn, train_history):
        if self.ls is None:
            self.ls = np.linspace(self.start, self.stop, nn.max_epochs)

        epoch = train_history[-1]['epoch']
        new_value = float32(self.ls[epoch - 1])
        getattr(nn, self.name).set_value(new_value)

现在让我们把这些变化放到一起，并开始准备训练网络：

net4 = NeuralNet(
    # ..

最低0.47元/天解锁文章

SuPhoebe

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
用卷积神经网络检测脸部关键点的教程（三）学习率，学习动量，dropout

本文翻译自Using convolutional neural nets to detect facial keypoints tutorial。用卷积神经网络检测脸部关键点的教程（一）环境配置与浅层网络训练用卷积神经网络检测脸部关键点的教程（二）卷积神经网络训练和数据扩充用卷积神经网络检测脸部关键点的教程（三）学习率，学习动量，dropout 用卷积神经网络检测脸部关键点的教程（四）通过
复制链接

扫一扫