中值频率平衡:图像分割中一种定量计算类别权重的方法

最新推荐文章于 2023-12-18 23:53:29 发布

GHZhao_GIS_RS

最新推荐文章于 2023-12-18 23:53:29 发布

阅读量1.8k

点赞数 11

分类专栏：深度学习文章标签：深度学习类别权重

本文链接：https://blog.csdn.net/u014311125/article/details/109380534

版权

深度学习专栏收录该内容

47 篇文章 51 订阅

订阅专栏

在多数情况下，图像分割都会遇到类别不均衡的情况，这时候需要通过权重参数来调节各类之间的比重，一般不同类别的权重占比需要通过多次实验调整，这里介绍一种计算类别的权重占比的方法:中值频率平衡，实际应用时还需要在这个基础上做微调。

计算原理：

在这里插入图片描述
$freq_c=\frac{sum_c}{sum_{pc}}$
上式中 $freq_c$ 代表第c类像素在训练集中出现的频率， $sum_c$ 表示第c类像素的个数， $sum_{pc}$ 代表的是包含第c类的图片的总像素数。这里计算的并不是训练集中的总像素数，而是只计算包含第c类像素的图片的总像素数。

$\alpha_c=\frac{median\_freq_c}{freq_c}$
上式中 $\alpha_c$ 代表第c类像素的权重， $median\_freq_c$ 表示的是所有类别的频率的中值。

代码

import os
import cv2
import numpy as np

label_dir = r"D:\data\RS\correct20201010\clip_512_1024\train\label"

n_classes=3
count = np.zeros(n_classes)
image_count=np.zeros(n_classes)
images=os.listdir(label_dir)
for image in images:
    label_img = os.path.join(label_dir,image)
    print(label_img)

    data =cv2.imdecode(np.fromfile(label_img,dtype=np.uint8),-1)

    for c in range(n_classes):
        # count[c]+=np.sum(data==c)
        c_sum = np.sum(data==c)  #统计c类像素的个数
        count[c]+=c_sum
        if  np.sum(data==c)!=0:  #判断该图片中是否存在第c类像素，如果存在则第c类图片个数+1
            image_count[c]+=1

#各类像素占总像素数的比例
print("每一类的像素数：",count)
print("像素总个数",np.sum(count))
print("每一类像素数占总像素数的比值",(count/np.sum(count)))

#中值频率平衡
print("包含每一类像素的图片个数:",image_count)
frequency=count/(image_count*512*512)     #图片大小为512*512
print("像素出现频率",frequency)
median=np.median(frequency)
weight=median/frequency
print("每一类的权重",weight)

参考

1、《Predicting Depth, Surface Normals and Semantic Labels with a Common Multi-Scale Convolutional Architecture》
2、《SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation》