最近在做一些有关医疗影像分割的工作,常常见到先对预测结果进行softmax再进行max的操作,之前一直没有深入理解,最近经过多次测试,找出其这样做的目的。
先说softmax,对于dim=1,说明是固定了第一维,例如数组[2,3,4]
其求的便是按照[0,0,0][0,1,0][0,2,0]的索引进行之后的运算操作,即
其实在求分割的时候,dim=1意味着什么?意味着不同的channel,而channel代表所属的类别是什么,例如channel1代表肺部,channel2代表肝脏,其实此处求Softmax就是为了求预测结果属于某个脏器的概率。
而对于之后的max(dim=1).
首先解释一下,对于求max,索引恰好相反,对于dim=1,则是在固定dim=0,2的前提下求最大值,如此来说,dim=1则可以视作求哪个channel的概率最大,也就是该体素属于那种器官的概率最大,并且,最终max回返回一个索引,也就是哪个channel的概率最大,这样返回的结果就是0,1,2...,可以直接视为分割结果了!