VGG NET

最新推荐文章于 2024-09-19 08:58:33 发布

awrX

最新推荐文章于 2024-09-19 08:58:33 发布

阅读量103

点赞数

文章标签：深度学习 cnn 神经网络

本文链接：https://blog.csdn.net/a23er2343/article/details/129824169

版权

vggnet的网络特点：用非常小的卷积核（比如3*3）去提取特征，但网络的层数非常深

卷积神经网络CNN的 conv层、全连接层常用激活函数是 relu

VGG net 池化后再做卷积，要把特征图个数翻倍，即卷积核（滤波器）个数翻倍，或者层输出单元个数翻倍

vgg，resnet等网络再热门框架中都是有现成的，一般不需要修改网络输出单元的个数，要调整网络的超参数（ lr 和批大小）

使用二维CNN实现目标分类

lr = 0.01； barch_size= 32；

opt = SGD(lr=INIT_LR, decay=INIT_LR / EPOCHS)#使学习率在每次迭代时衰减

val-loss 验证集损失上下浮动很大。存在过拟合

① lr = 0.01； barch_size= 32；并在每个relu 层后添加 BN 批归一化层。

model.add(Conv2D(32, (3, 3), padding="same",
			input_shape=inputShape,
kernel_initializer=TruncatedNormal(mean=0.0, stddev=0.01)))
		model.add(Activation("relu"))
		model.add(BatchNormalization(axis=chanDim))
		model.add(MaxPooling2D(pool_size=(2, 2)))

将程序运行两次，虽然都添加了 BN 归一化层，但由于CNN2D和全连接层的初始权重未作限制，会导致初始的损失值浮动很大。

比如 val-loss1=4.0 ；val-loss2 =1.0；

对BN2，随机的初始权重值较好

② 再在每个 conv2D层和 Dense全连接层添加 kernel_initializer ，让初始权重服从截断的高斯分布，以避免出现像BN1 那样卷积层的卷积核初始权值和 Dense层的【w b】取随机初始值的效果不好使模型初始 loss损失值较大的情况。

model.add(Conv2D(32, (3, 3), padding="same",
			input_shape=inputShape,
kernel_initializer=TruncatedNormal(mean=0.0, stddev=0.01)))

怎么感觉对模型加了初始化权值限制，效果还没BN2好，这是有可能的，因为即使加了kernel_initializer=TruncatedNormal(mean=0.0, stddev=0.01)))后，权值只是在一定范围内随机取初始值，还是取再取初值。

随机权重值可能在某些点处出现尖点 --------如 epoch = 13时 val-loss = 1.6

解决方法：1. 多试验几次，选取效果好的初始权重值

2. 查看keras文档，寻找更多抗过拟合和 cunv层和Dense层中添加更多初始化权重参数的方法

③ 添加 Dropout 层

注：由于同一个卷积层的不同卷积核 fliter的 权值是共享的，所以给CONV层添加Dropout会使训练集精度下降，而验证集没有太大提升，因此一般是在全连接层输出后添加Dropout ，相当于给全连接层添加随机丢弃

		model.add(Flatten())
		model.add(Dense(512,kernel_initializer=TruncatedNormal(mean=0.0, stddev=0.01)))
		model.add(Activation("relu"))
		model.add(BatchNormalization())
		model.add(Dropout(0.6))

可以发现，尽管加了批归一化BN，kernal_size截断初始化，Dropout 等方法，模型仍然存在过拟合。

此时，要意识到数据决定模型的上限，而各种调参方法（多次实验）只是去接近数据的上限。要从数据角度入手，好的数据决定模型成败。

predict.py :

在全连接神经网络中，预测前需要把输入图像 flatten() ,拉成一维数据。

# 是否要对图像就行拉平操作
if args["flatten"] > 0:
	image = image.flatten()
	image = image.reshape((1, image.shape[0]))

而在CNN中，输入图像转换成二维图像输入（1，h，w，c）

else:
	image = image.reshape((1, image.shape[0], image.shape[1],
		image.shape[2]))

awrX

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫