paddle深度学习基础之损失函数
前言
文章目录
上一节,咱们通过优化网络结构,极大的提升了模型的精准度。本节,咱们将在损失函数上面做些文章。
网络结构
损失函数
一、损失函数漫谈
还记得我们之前做的房价预测模型,使用的损失函数是均方差损失函数。这对于房价预测模型这种需要模型不断接近真实房价,是比较合适的。但是对于分类模型,我们所预测的值是离散。举个例子,一张动物图片,我们来预测是猫、狗、牛。我们会假定,输出结果为0的是猫,输出结果为1的是狗,输出结果为2的是牛。如果我们使用均方差损失函数,预测值和真实值相减,并不具备物理意义。所以,分类模型使用均方差损失函数是不合适的。那么,接下来会介绍一种损失函数,能够很好的用于分类模型中。
二、交叉熵损失函数
1. Softmax函数
在介绍交叉熵损失函数之前,我们需要引入Softmax函数。这个函数经常作为分类模型的激活函数,用于将模型输出的各个标签的值进行转化,转化为总和为1的概率值,公式如下:
s o f t m a x ( x i ) = e x i ∑ j = 0 N e j x , i = 0 , . . . , C − 1 softmax(x_i) = \frac {e^{x_i}}{\sum_{j=0}^N{e^x_j}}, i=0, ..., C-1 softmax(x