在多数情况下,图像分割都会遇到类别不均衡的情况,这时候需要通过权重参数来调节各类之间的比重,一般不同类别的权重占比需要通过多次实验调整,这里介绍一种计算类别的权重占比的方法:中值频率平衡,实际应用时还需要在这个基础上做微调。
计算原理
代码
import os
import cv2
import numpy as np
label_dir = r"D:\data\RS\correct20201010\clip_512_1024\train\label"
n_classes=3
count = np.zeros(n_classes)
image_count=np.zeros(n_classes)
images=os.listdir(label_dir)
for image in images:
label_img = os.path.join(label_dir,image)
print(label_img)
data =cv2.imdecode(np.fromfile(label_img,dtype=np.uint8),-1)
for c in range(n_classes):
# count[c]+=np.sum(data==c)
c_sum = np.sum(data==c) #统计c类像素的个数
count[c]+=c_sum
if np.sum(data==c)!=0: #判断该图片中是否存在第c类像素,如果存在则第c类图片个数+1
image_count[c]+=1
#各类像素占总像素数的比例
print("每一类的像素数:",count)
print("像素总个数",np.sum(count))
print("每一类像素数占总像素数的比值",(count/np.sum(count)))
#中值频率平衡
print("包含每一类像素的图片个数:",image_count)
frequency=count/(image_count*512*512) #图片大小为512*512
print("像素出现频率",frequency)
median=np.median(frequency)
weight=median/frequency
print("每一类的权重",weight)
参考
1、《Predicting Depth, Surface Normals and Semantic Labels with a Common Multi-Scale Convolutional Architecture》
2、《SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation》