在做活体检测的时候,出现这样的结果,4000张假脸全部认为是真脸,非常不合理,
理论上二分类就算是瞎猜也应该有0.5的概率判断是对的,
出现这种可能的原因是样本不均衡,但我的不属于这种,最后的原因是测试时候的预处理和模型训练中不一样,更改后结果正确。
注意维度、图片的预处理、还有图片读入的方式,模型训练中用的 Image.open 读入的图片,而我的离线测试代码中用的cv2.imread(), 还有ndarray转换为tensor的方法都应与训练时保持一致。
注意!!!预处理会影响模型的效果,影响还不是一点点,所以在代码设计的时候,就应该只写一个预处理函数,保证训练和测试的图片在读入后都进行了相同的处理。
def preprocess(image):
img = Image.open(image)
img = np.asarray(img, dtype='uint8')
img = cv2.resize(img, (112, 112))
img = img.reshape((112, 112, 1))
img = np.concatenate((img, img, img), axis=-1)
# print(img.shape)
img = np.transpose(img, (2, 0, 1))
# img = img.reshape([3, 112, 112])
# print(img.shape)
img = img.astype(np.float32)
img1 = cv2.Scharr(img, cv2.CV_8U, 0, 1) # cv2.Sobel(img, cv2.CV_8U, 0, 1)
img2 = cv2.Scharr(img, cv2.CV_8U, 1, 0)
img = np.abs(img1) + np.abs(img2)
img = img[np.newaxis, :, :, :]
# print(img.shape)
return torch.FloatTensor(img)