MXNET框架，faster rcnn 训练正常，正确率很高，但是使用demo测试出现异常，框虚标，出现乱框，vgg16正常，resnet网络异常，PIXEL_MEANS问题

最新推荐文章于 2024-08-14 18:30:34 发布

wang_ys121

最新推荐文章于 2024-08-14 18:30:34 发布

阅读量2.1k

点赞数 2

分类专栏： mxnet 深度学习文章标签： mxnet faster rcnn 框不准 resnet demo

本文链接：https://blog.csdn.net/wang_ys121/article/details/81285980

版权

在MXNET框架下使用Faster R-CNN训练Resnet网络进行目标检测时，尽管训练过程正常，但在使用demo测试时发现框定位不准。问题出在PIXEL_MEANS配置上，Resnet测试时需要的PIXEL_MEANS不同于VGG的默认值。解决方案包括修改demo文件中PIXEL_MEANS的值以及在执行时通过--network resnet参数动态调整config中的PIXEL_MEANS值。正确设置后，测试结果恢复正常。

摘要由CSDN通过智能技术生成

首先，使用的是mxnet框架，检测框架是faster rcnn，使用网络是resnet和vgg，项目地址是github mxnet apache里面的\incubator-mxnet-master\incubator-mxnet-master\example\rcnn\，这个项目已经在7月中旬的时候被官方修改了，这里讨论的情况是旧的项目代码。我首先使用自己的数据集，格式是Pascal Voc格式，将trainvol和图片进行替换，然后使用resnet101网络进行训练，训练的过程正常，正确率和loss都很正常，但是使用修改过的demo文件测试单张图片时出现异常，（demo文件本来是测试vgg网络的，我这里将里面的vgg改成了resnet了），异常如下图所示，

检测图片的结果是框框出现漂移，不准，只有一个或两个准的，根据训练的loss来看这是不正常的，不可能这么差的效果。