深度学习之CNN层调参经验与Drop层、BN层的使用经验

最新推荐文章于 2022-10-16 20:39:32 发布

a flying bird

最新推荐文章于 2022-10-16 20:39:32 发布

阅读量1.9k

点赞数 1

分类专栏：深度学习

本文链接：https://blog.csdn.net/m0_37870649/article/details/80861003

版权

深度学习专栏收录该内容

19 篇文章 0 订阅

订阅专栏

相关参考：

https://www.cnblogs.com/bonelee/p/8534560.html

https://blog.csdn.net/sean2100/article/details/83834565

https://blog.csdn.net/sean2100/article/details/83783632

两篇文章主要给了两个结论：

结论一：CNN 文本分类模型优化经验——关键点：加卷积层和FC可以提高精度，在FC前加BN可以加快收敛，有时候可以提高精度，FC后加dropout，conv_1d的input维度加大可以提高精度，但是到256会出现OOM。

结论二：应该仅在全连接层上使用Dropout操作，并在卷积层之间使用批量标准化（BN）。

*********************************************************************************************************************************************

结论一对应的内容

network = tflearn.input_data(shape=[None, max_len], name='input')
network = tflearn.embedding(network, input_dim=volcab_size, output_dim=32)

network = conv_1d(network, 64, 3, activation='relu', regularizer="L2")
network = max_pool_1d(network, 2)
network = conv_1d(network, 64, 3, activation='relu', regularizer="L2")
network = max_pool_1d(network, 2)
#network = conv_1d(network, 64, 3, activation='relu', regularizer="L2")
#network = max_pool_1d(network, 2)

network = batch_normalization(network)

#network = fully_connected(network, 512, activation='relu')
#network = dropout(network, 0.5)
network = fully_connected(network, 64, activation='relu')
network = dropout(network, 0.5)

network = fully_connected(network, 2, activation='softmax')

迭代一次，acc是98.5%多一点。

如果使用：

# 关于一维CNN的网络，例子较少
# https://github.com/tflearn/tflearn/blob/master/examples/nlp/cnn_sentence_classification.py
# Building convolutional network
network = input_data(shape=[None, 100], name='input')
network = tflearn.embedding(network, input_dim=10000, output_dim=128)
branch1 = conv_1d(network, 128, 3, padding='valid', activation='relu', regularizer="L2")
branch2 = conv_1d(network, 128, 4, padding='valid', activation='relu', regularizer="L2")
branch3 = conv_1d(network, 128, 5, padding='valid', activation='relu', regularizer="L2")
network = merge([branch1, branch2, branch3], mode='concat', axis=1)
network = tf.expand_dims(network, 2)
network = global_max_pool(network)
network = dropout(network, 0.5)
network = fully_connected(network, 2, activation='softmax')
network = regression(network, optimizer='adam', learning_rate=0.001,
loss='categorical_crossentropy', name='target')
# Training
model = tflearn.DNN(network, tensorboard_verbose=0)

acc是95%多一点点。

使用类似 vgg的模型， https://github.com/AhmetHamzaEmra/tflearn/blob/master/examples/images/VGG19.py

network = tflearn.input_data(shape=[None, max_len], name='input')
network = tflearn.embedding(network, input_dim=volcab_size, output_dim=64)
network = conv_1d(network, 64, 3, activation='relu')
network = conv_1d(network, 64, 3, activation='relu')
network = max_pool_1d(network, 2, strides=2)
network = conv_1d(network, 128, 3, activation='relu')
network = conv_1d(network, 128, 3, activation='relu')
network = max_pool_1d(network, 2, strides=2)
network = conv_1d(network, 256, 3, activation='relu')
network = conv_1d(network, 256, 3, activation='relu')
network = conv_1d(network, 256, 3, activation='relu')
network = max_pool_1d(network, 2, strides=2)
network = batch_normalization(network)
network = fully_connected(network, 512, activation='relu')
network = dropout(network, 0.5)
network = fully_connected(network, 2, activation='softmax')

acc是98.5%多一点,稍微比第一种模型高，但是训练时间太长。

其他的，本质上都是加卷积层或者FC：

。。。
network = conv_1d(network, 64, 3, activation='relu', regularizer="L2")
network = max_pool_1d(network, 2)
network = conv_1d(network, 64, 3, activation='relu', regularizer="L2")
network = max_pool_1d(network, 2)
network = conv_1d(network, 64, 3, activation='relu', regularizer="L2")
network = conv_1d(network, 64, 3, activation='relu', regularizer="L2")
network = max_pool_1d(network, 2)
。。。

*****************************************************************************************************************************

结论二对应的内容

地址：https://blog.csdn.net/sean2100/article/details/83783632

应该仅在全连接层上使用Dropout操作，并在卷积层之间使用批量标准化。

a flying bird

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
深度学习之CNN层调参经验与Drop层、BN层的使用经验

相关参考：https://www.cnblogs.com/bonelee/p/8534560.htmlhttps://blog.csdn.net/sean2100/article/details/83834565https://blog.csdn.net/sean2100/article/details/83783632两篇文章主要给了两个结论：结论一：CNN 文本分类模...
复制链接

扫一扫