ssd网络训练loss下降但是精度提不上去_12分钟训练COCO模型！速度精度双提高

最新推荐文章于 2024-06-19 15:31:46 发布

weixin_39882271

最新推荐文章于 2024-06-19 15:31:46 发布

阅读量1.9k

点赞数

文章标签： ssd网络训练loss下降但是精度提不上去

本文链接：https://blog.csdn.net/weixin_39882271/article/details/111375106

版权

【摘要】中科院自动化所图像与视频分析组提出一种基于周期性矩衰减优化的大规模目标检测快速训练方法。该方法在保持精度的前提下，充分利用大规模集群的计算优势，成功将目标检测任务的batch size扩大到1000以上，大幅度地减少训练时间。同时，该方法在大规模检测数据集OpenImages上也带来了10个点以上的性能提升。该文已被ECCV 2020 收录。

近日，中科院自动化研究所图像与视频分析组提出了一种针对目标检测任务的大批次(large batch)快速训练的优化算法Periodical Moments Decay LAMB(PMD-LAMB，周期性矩衰减的LAMB算法)。该算法首次提出对LAMB算法[1]中的累积一阶矩和二阶矩实现周期性衰减，从根本上摆脱了滞后的历史梯度对当前网络优化的负面影响，有效加快神经网络的收敛速度。

在此基础上，本文提出了一个适用于目标检测任务的大批次目标检测训练框架LargeDet， 突破了当前检测器只能用小batch size的训练约束，第一次将目标检测任务的训练batch size扩大到1056并且保持网络的收敛性。 通过使用大batch size训练，该方法首次将COCO的检测训练时长缩短至12min，将实例分割 (Instance Segmentation) 的训练时长缩短至17min，真正实现检测模型的分钟级迭代。同时，该方法在大规模检测数据集OpenImages上也有大幅度的性能涨点。

研究背景

近年来，深度学习遇到的一大挑战就在于模型的训练时间上。比如，在一个英伟达的 M40 GPU 上用 ResNet50 去训练 ImageNet 需要 14 天；如果用一个串行程序在单核 CPU 上训练可能需要几十年才能完成，这个问题的凸显在某种程度上限制着深度学习的发展。在新的模型设计过程中，研究人员需要不断地调整模型，将调整过的模型拿去做实验，然而每次的实验结果都需要等待几天到几十天左右，这在一定程度上拉低了设计效率。

所以，在几个小时之内完成大型神经网络的训练对节省时间和提升效率具有重要意义。

而目标检测是智能视觉感知与理解的基础，目前被广泛应用在现实生活中的各个领域，如智能视频监控、自动驾驶、工业检测，无人超市等。目标检测在于检测图片中所有感兴趣类别的物体，并给出尽可能准确的包围框，从而加强了对模型设计的要求，同时也加重了模型训练的难度。

而目前，数据体量不断增大，比如，OpenImages图像集包含了超过3000万张图片和1500万个边界框(标签)，那是18TB的图像数据！传统的小batch size训练方法往往要耗费至少几周的时间才能完成对一个检测模型的训练，如使用单机高配8块V100 GPU训练Res50-FPN和 Res101-FPN，分别需要3.6天和4.5天，这极大地延长了算法的迭代周期，不利于快速探索各种新技术。

因此，设计针对目标

最低0.47元/天解锁文章

weixin_39882271

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
ssd网络训练loss下降但是精度提不上去_12分钟训练COCO模型！速度精度双提高

【摘要】中科院自动化所图像与视频分析组提出一种基于周期性矩衰减优化的大规模目标检测快速训练方法。该方法在保持精度的前提下，充分利用大规模集群的计算优势，成功将目标检测任务的batch size扩大到1000以上，大幅度地减少训练时间。同时，该方法在大规模检测数据集OpenImages上也带来了10个点以上的性能提升。该文已被ECCV 2020 收录。近日，中科院自动化研究所图像与视频分析...
复制链接

扫一扫