nn.BCELoss与nn.CrossEntropyLoss的区别_crossentropy 和 bce的区别-CSDN博客

本文链接：https://blog.csdn.net/u011330902/article/details/104823421

nn.BCELoss与nn.CrossEntropyLoss的区别

最近的工程涉及到超分辨率增强的相关研究，阅读SRGAN的源代码的时候发现，在损失函数的设置上，生成器和判别器分别用了不同的损失函数：

        self.criterionG = nn.MSELoss()
        self.criterionD = nn.BCELoss()

并且，判别器使用的是BCELoss，经过查询，把nn.BCELoss与nn.CrossEntropyLoss的区别在这里写一下，避免遗忘。

首先是共性：
BCELoss是Binary CrossEntropyLoss的缩写，BCELoss　CrossEntropyLoss的一个特例，只用于二分类问题，而CrossEntropyLoss可以用于二分类，也可以用于多分类。

区别：
使用nn.BCELoss需要在该层前面加上Sigmoid函数。
使用nn.CrossEntropyLoss会自动加上Softmax层。

此外，如果你也是从GitHub上Clone的PyTorch版本的SRGAN代码，需要注意在solver中的train函数中，判别器的Loss是直接使用的生成图与GroundTruth的像素MSE，而非原论文中的VGG提取特征MSE，即：

            # 这个地方(👇)是直接用生成器生成的图，和GroundTruth计算的MSE，而原论文里好像是用VGG提取特征再计算MSE
            mse_loss = self.criterionG(g_real, target)