GooLeNet 炼丹日记（cifar-100)

wearecomming

已于 2022-06-01 19:02:52 修改

阅读量2.6k

点赞数 3

文章标签：深度学习 pytorch 神经网络

于 2022-05-17 09:17:40 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44664223/article/details/124700192

版权

博主通过多次迭代优化GoogLeNet模型进行CIFAR-100数据集的分类任务，从初始的48%准确率逐步提升到63.1%。主要改进包括学习率衰减、数据增强（如图像反转和随机亮度调整）、增加训练轮数以及调整优化器设置。在训练过程中，博主观察到过拟合现象并采取措施缓解，如使用平均池化替代全连接层，加入辅助分类器，以及应用数据扩增技术。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

进行cifar-100的分类任务，打算采取GooLeNet(v1)模型进行识别。目标是准确度达到60%以上。

GoogLeNet采用了模块化的结构（Inception结构），在Inception中采用不同核的卷积层来保证在不同的尺度上提取特征。

其中采用了1*1的卷积层来进行降维，减少计算复杂度。同时由于在不同的卷积核上提取特征，产生的特征包含多个密集联系的子特征集（如下图），使得非关键特征被弱化，从而减少冗余，加快计算。

goolenet具体结构如下：

goolenet最后采用了average pooling（平均池化）来代替全连接层,具体方法就是对每一个feature上的所有点做平均，有n个feature就输出n个平均值作为最后的softmax的输入,这样可以有效地防止过拟合。

可以看到在网络的中间有两个辅助分类器，因为在中间产生的特征也有很强的分类型，在训练的时候使用三个分类器结合判断损失函数的方式可以有效地提升精确度。

下面是训练参数和细节

第一次炼丹：

学习率为0.0002

batch为128

采用Adam优化器

训练30次

跑了一天，准确度为48%

后期波动较大

打算采用学习率衰减

每过8次训练学习率减半

改进后投入炼丹炉，等待结果。

第二次炼丹

准确度为50.6%，提升了2%

第三次炼丹

今天看gpu利用率的时候，发现我的gpu利用率为0%，然后我就明白为什么的的模型只跑了30个epoch就要跑一整天了。。

于是在dataloder中加上num_workers=8,pin_memory=True，gpu的利用率直接就达到了99%，训练一个epoch只要两分钟。。。（我觉得我可以直接跑200个epoch了）

发现结果loss如下：

依旧是过拟合的问题，考虑数据增强，暂时先对于图片数据进行随机水平反转，并采用训练集随机读入的方式。

第四次炼丹

效果显著（应该是随机读入的方式使网络避免产生惯性），最高准确度达到了55.4%，提升了5%。

loss如下：

可以看见在最末尾还是loss有上涨的趋势，说明过拟合问题没有完全解决。

在最后准确度还有上涨的趋势，所以打算增加训练轮数为40轮。

然后我发现之前我在定义adam优化器的时候把它放在训练循环里，导致它无法使用自适应学习率。所以把它移到最开始的超参数定义的地方。

第五次炼丹

最高准确度为58%，提升了3%

后期又出现了过拟合的趋向。

打算再加大训练轮数。

第六次炼丹

这次我直接训练100轮，终于在其中一轮中出现了一个准确率为60.05735759493671的模型。

初步目标算是完成了，但是过拟合造成的高损失也到了一个很离谱的状态：

部分结果可视化如下：

以后有空了在看看怎么优化吧。

第七次炼丹

这次使用了图像反转和随机亮度来扩增数据集并且在第六次炼丹的权重基础上再进行100轮次训练。

其中最高准确率达到了63.1%，增加了3.1%

可见数据集扩增是有效的。

博客等级

码龄6年

5
原创

10
点赞

11
收藏

4
粉丝

关注

私信

热门文章

最新评论

calculator base on front-end and back-end
CSDN-Ada助手: 恭喜您撰写了第四篇博客！标题“calculator base on front-end and back-end”非常吸引人，让我对您的博客产生了浓厚的兴趣。您通过前端和后端技术实现计算器功能的方法让我感到非常好奇。我期待能够通过阅读您的博客了解更多关于前后端结合开发的知识。在您的下一篇博客中，我希望您能够分享一些关于前后端分离开发的实践经验。例如，您可以介绍如何优化前端页面的性能，如何处理前后端的数据传输等等。这些实用的经验对于我们这些初学者而言将会非常有益。再次感谢您的辛勤创作，期待您能够继续为我们带来更多有趣且有启发性的博客！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
Visual Calculator Based on Python
CSDN-Ada助手: 恭喜您持续创作，并且这篇博客的主题“Visual Calculator Based on Python”听起来非常有趣！通过Python构建一个可视化计算器，这听起来确实是一个令人兴奋的项目。我非常期待阅读您的博客，因为我相信您会详细介绍这个项目的实现过程和所用到的技术。在下一步的创作中，我想提个建议，如果可能的话，您可以考虑分享一些在构建这个可视化计算器过程中遇到的困难和解决方案，这将对读者来说是非常有帮助的。另外，如果您能提供一些额外的代码示例或者一些实用的技巧，将会使您的博客更加丰富和有趣。继续保持创作，并分享您的知识和经验，我相信您会给读者们带来更多的启发和学习机会。期待在您未来的博客中看到更多精彩的内容！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。