训练过程总结问题(一)

最新推荐文章于 2024-03-15 21:06:36 发布

米小凡

最新推荐文章于 2024-03-15 21:06:36 发布

阅读量706

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiaomifanhxx/article/details/88082652

版权

最近在做烟盒检测的U型分类，主要是来查看烟盒的摆放是否是U型排列（相同类别的烟盒）。

通过目标检测将每一张图含有的烟盒检测出来，并进行分类，并统计每一类烟盒的出现在该图像的频率，一般数目为6个及以上的数量才能构成U型排列，因此，统计出哪类烟盒出现在图像的次数超过6次，并将其生成二值化图，用于U型分类，主要是类似于Minist手写数字，但是在训练过程中遇到了诸多问题。

首先使用了类似Alexnet网络构造的模型，但是train_loss为5.多而且不收敛，train_acc约为.6左右，valid_acc约为0.7左右，两个accuracy基本上都不变化。

可能造成该问题的原因及分析:

(1)正负样本的训练比例是2:1，测试样本为3:1，因此可以大概判断出精确度跟瞎猜一样，根本没有学习到任何东西，可能掉入了局部最优点。解决：训练初期使用较高的学习率。

(2)本来以为是网络的网络结构有问题，但是在分析过程中使用了更深的网络，结果跟使用Alexnet类似，于是分析可能是网络结构太深，直接掉入局部最优点。

(3)还以为是网络初始化的问题，分别使用了xavier,uniform,random_norm参数进行初始化，结果造成的影响均一致，因此判断网络结构以及学习率对其影响更大。

(4)采用了削减网络，由于最大池化层虽然保持了尺度不变性和旋转不变性，但是其减少了全局信息，因此第一步将最大池化层全部剔除并增大学习率，valid_acc在逐步提升，达到了80%.但是，这远远不够，于是采用了只含有两个全连接层的网络结构，结果valid_acc高达98%,由此可见全连接层对于全局信息看的还是清楚。但是，由于使用了全连接层，其参数过大为1GB因此，不再使用全连接层，还是改为了全卷积(通过卷积来调整featuremap的大小)+1Dense，在不断的调解学习率，使得valid_acc为95，其参数只为8M。

(5)在后一次训练期间，由于label的不平衡，所以首先做了dataAugument,随机裁减了正样本作为负样本使用。

(6)由于Maxpooling会使得图像失去全局信息，因此不能使用Maxpooling,但是在实际中U型排列会出现在图像各处，因此我们先将U型排列置于图像中间即对其进行裁剪，然后再送入网络中训练、学习，网络最后得到的featuremap的大小16*16不算小。

针对上述出现的问题，我们进行了一系列的操作。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。