darknet中YOLO分类损失梯度源码理解

最新推荐文章于 2024-07-12 19:58:07 发布

Jimyang1ssa

最新推荐文章于 2024-07-12 19:58:07 发布

阅读量1.9k

点赞数 1

分类专栏：深度学习计算机视觉

本文链接：https://blog.csdn.net/jiyangsb/article/details/81976090

版权

深度学习同时被 2 个专栏收录

13 篇文章 2 订阅

订阅专栏

计算机视觉

6 篇文章 0 订阅

订阅专栏

之前一直对darknet中的分类损失梯度计算函数有些不太明白，不清楚为何在开始还有有一段对delta[index]是否为0的判断。后来思考了一下，觉得应该是这个原因。首先看一下这段代码：

void delta_yolo_class(float *output, float *delta, int index, int class, int classes, int stride, float *avg_cat)
{
    int n;
    if (delta[index]){
        delta[index + stride*class] = 1 - output[index + stride*class];
        if(avg_cat) *avg_cat += output[index + stride*class];
        return;
    }
    for(n = 0; n < classes; ++n){
        delta[index + stride*n] = ((n == class)?1 : 0) - output[index + stride*n];
        if(n == class && avg_cat) *avg_cat += output[index + stride*n];
    }
}

我们知道，在YOLO_v3中类别损失函数使用的是sigmoid-loss，而不是使用softmax-loss。分类时使用sigmoid损失函数时，由于在使用真值框的中心点计算得到的最后一层feature map上的点位置存在量化误差，feature map上的点只能为整型，因此可能会存在两个靠的很近的真值框中心点计算出的位置在feature map上的坐标点位置是一样的，出现这种情况时，对应的class梯度已经在前一个真值框计算时计算过，而新的真值框计算class梯度时，没有必要将原来的class_delta全部覆盖掉，只需要更新对应class label对应的sigmoid梯度即可，因此这样的操作方式可能导致一个目标框的几个类别概率都比较大（即多label）。

当然，如果计算分类损失时使用softmax-loss就没必要这样做了。因为softmax计算出的类别概率是互斥的，不像使用sigmoid计算分类损失，因为每个类别都使用一个sigmoid计算其分类损失，他们的类别不是互斥的，因此可以使用代码中描述的操作方式，使用softmax-loss计算分类损失梯度时，第一部分代码可以直接忽略，让新的目标框类别梯度覆盖原来的即可。