一.在用自己数据集跑transunet代码时,由于是二分类问题,将n_classes改了后出现以下问题:
该问题的描述是标签里面的像素值不在[0,n_classes]范围内,在github上发现也有人有相应问题,但都未解决。后面发现又报了cuda的问题,所以应该先将gpu停用,用cpu跑程序来排查是不是gpu问题。后面跑下来发现依然报错,且指向了反向传播,故不是gpu问题,接着又排查了一圈,最终发现应是损失函数的问题。因为transunet是多分类,故用的是crossenter函数,该函数适用于多分类的交叉熵函数,如果要用在二分类,需将fc输出层分类数改为2,只不过笔者在此直接用二分类交叉熵函数bceloss替代,自此,该问题解决,回顾问题,发觉还是需要先用cpu跑去发现问题最重要。
二.对于label图像的处理,一般灰度图像保存为png或者tif为好,因为这样在对label进行处理成像素值为[0.255]并保存时,不会出现其他的像素值,如果保存为jpg格式,就会出现上述问题,jpg格式一般用来保存彩色图像。