深度学习中Hyperparameters的选取过程

最新推荐文章于 2025-04-15 10:47:53 发布

Hope_epoh

最新推荐文章于 2025-04-15 10:47:53 发布

阅读量1k

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习文章标签：深度学习超参数选择

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010970514/article/details/81915246

最近正在利用深度学习网络进行人脸识别，涉及到网络的Hyperparameters的选取，过程中遇到了很多问题，整理汇总起来以便日后避坑。配置环境为Ubuntu+tensorflow_gpu+python3.6

整个选取流程如下：随机生成一组某区间范围内的学习率，对每个学习率利用10折交叉验证法，求得在训练少量epoch之后模型在验证集上的平均准确率，最后选取使平均准确率最大的学习率。

1. 困扰最久的问题是如何重新初始化Graph中的每个trainable_variables。因为在每个fold开始时，需要对整个网络重新训练，即要求各trainable_variables重新初始化。这里最简单的方法就是在每个需要重新初始化trainable_variables之前，再次调用sess.run(tf.global_varibles_initializer())即可，代码如下：

import tensorflow as tf
import numpy as np

x = tf.placeholder(tf.float32, shape=(1,3), name='x')
w = tf.get_variable('w', shape=(3,1), initializer=tf.contrib.layers.xavier_initializer(seed=0))

y = tf.matmul(x, w)
loss = (y - 0.3) ** 2

train_op = tf.train.GradientDescentOptimizer(0.01).minimize(loss)

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    print

最低0.47元/天解锁文章

博客等级

码龄12年

9
原创

23
点赞

27
收藏

3
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

下一篇：: Python常用模块整理

最新评论

OpenCV getTextSize函数中的baseLine参数
玉汝成: 是因为字体完整的高度是height+baseline，只有baseline或者height显示是不完整的，你可以对照上图看看。时间有些久远了，应该是这样，你可以写个demo试一下。
OpenCV getTextSize函数中的baseLine参数
k_szlk: 请问为什么要加上height? 谢谢
OpenCV getTextSize函数中的baseLine参数
玉汝成: 很好，难怪调用putText的时候需要设置起始Point的y轴坐标需要加上text的height和baseline参数……
Dijkstra算法的两种实现
西红柿茶叶蛋: 其他很多博客逻辑都太乱了，似懂非懂。只给出代码，注释也不清晰，反而没什么参考价值。这篇好评！
Batch Normalization推导过程
Lloyd-He: 最后的对xi求导好像有问题

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。