1.问题描述
最近在看语义分割的源码,但是预测阶段有一行代码看的我头大,不知道在索引些什么东西。后来经过查阅资料和实验发现这是numpy的高级索引,故写这篇博文记录一下自己是如何理解的。这行代码长这样。意思是把前向传播得到的预测值取最大值,并把最大值的索引值赋值给pre_label((352,480)的矩阵)。这个索引值代表了一张图经过模型的预测后,每一个像素值分别属于哪一个类别。通过这张全图都是索引值的图,去cm(color map)中找属于这个索引值的相应颜色(每个索引值对应了RGB3个通道的颜色),其中最关键的一部分就是pre = cm[pre_label]这一行代码。
for i, sample in enumerate(test_data):
valImg = sample['img']