在多数情况下,图像分割都会遇到类别不均衡的情况,这时候需要通过权重参数来调节各类之间的比重,一般不同类别的权重占比需要通过多次实验调整,这里介绍一种计算类别的权重占比的方法:中值频率平衡,实际应用时还需要在这个基础上做微调。
计算原理:
f
r
e
q
c
=
s
u
m
c
s
u
m
p
c
freq_c=\frac{sum_c}{sum_{pc}}
freqc=sumpcsumc
上式中
f
r
e
q
c
freq_c
freqc代表第c类像素在训练集中出现的频率,
s
u
m
c
sum_c
sumc表示第c类像素的个数,
s
u
m
p
c
sum_{pc}
sumpc代表的是包含第c类的图片的总像素数。这里计算的并不是训练集中的总像素数,而是只计算包含第c类像素的图片的总像素数。
α
c
=
m
e
d
i
a
n
_
f
r
e
q
c
f
r
e
q
c
\alpha_c=\frac{median\_freq_c}{freq_c}
αc=freqcmedian_freqc
上式中
α
c
\alpha_c
αc代表第c类像素的权重,
m
e
d
i
a
n
_
f
r
e
q
c
median\_freq_c
median_freqc表示的是所有类别的频率的中值。
代码
import os
import cv2
import numpy as np
label_dir = r"D:\data\RS\correct20201010\clip_512_1024\train\label"
n_classes=3
count = np.zeros(n_classes)
image_count=np.zeros(n_classes)
images=os.listdir(label_dir)
for image in images:
label_img = os.path.join(label_dir,image)
print(label_img)
data =cv2.imdecode(np.fromfile(label_img,dtype=np.uint8),-1)
for c in range(n_classes):
# count[c]+=np.sum(data==c)
c_sum = np.sum(data==c) #统计c类像素的个数
count[c]+=c_sum
if np.sum(data==c)!=0: #判断该图片中是否存在第c类像素,如果存在则第c类图片个数+1
image_count[c]+=1
#各类像素占总像素数的比例
print("每一类的像素数:",count)
print("像素总个数",np.sum(count))
print("每一类像素数占总像素数的比值",(count/np.sum(count)))
#中值频率平衡
print("包含每一类像素的图片个数:",image_count)
frequency=count/(image_count*512*512) #图片大小为512*512
print("像素出现频率",frequency)
median=np.median(frequency)
weight=median/frequency
print("每一类的权重",weight)
参考
1、《Predicting Depth, Surface Normals and Semantic Labels with a Common Multi-Scale Convolutional Architecture》
2、《SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation》