深度学习之损失函数

ufy

于 2022-10-10 16:43:54 发布

阅读量1.1k

点赞数

分类专栏： AI # DL # ML 文章标签：深度学习人工智能机器学习

本文链接：https://blog.csdn.net/antarm/article/details/127081045

版权

AI 同时被 3 个专栏收录

2 篇文章 2 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

损失函数

损失函数是用来衡量预测值与真实值的差距的。理论上能度量这种差距的函数都可以作为损失函数，但实际上不同的损失函数对不同问题有不同的表现。下面我将介绍一下主流的损失函数，并基于tensorflow实现。

1. binary_crossentropy

顾名思义，binary_crossentropy是针对二分类问题的一个损失函数。在数学上，其表达式如下：
$\sum_{i=0}^{n}[y_i log(\hat y_i) + (1-y_i)log(1-\hat y_i)]$
其中， $n$ 一般为batchsize, $y_i$ 是数据的标签值， $\hat y$ 是模型的输出值。此式是信息论中的交叉熵在损失函数中的应用，有兴趣的小伙伴可以看看信息论相关资料加深理解。

有必要说明，这里二分类最后的网络层只有一个神经元(激活函数sigmoid)，输出数值范围为 $[0, 1]$ ,表示的是模型人为该数据是A类的概率 $p$ 。而B类的概率就为 $1 - p$ 。这也就解释了上式原由。

实现代码如下：

import tensorflow as tf

def binary_crossentropy(y_true,y_predict,epsilon=1e-7):
	# epsilon 是为了防止log 0的出现
    loss = - tf.reduce_sum(y_true * tf.math.log(y_predict+epsilon) + (1-y_true) * tf.math.log(1-y_predict+epsilon)) 
    return loss

2. category_crossentropy

与二分类类似，只不过这里是多分类。具体的数学表达式如下：
$\sum_{i=0}^{n} \sum_{j=0}^C y_{ij}log(\hat y_{ij})$
其中，C是分类数。其他参数与binary_crossentropy同。

在多分类中，最后一层网络一般为 $k$ (类别数)个神经元(激活函数为softmax)。输出表示模型认为该数据在不同类别上的概率分布，此时 $y_{true}$ 一般需要转换为ont_hot格式。
代码实现如下：

def category_crossentropy(y_true,y_predict,epsilon=1e-7):
    # loss = -tf.reduce_sum(tf.reduce_sum(y_true * tf.math.log(y_predict+epsilon),axis = -1))
    loss = -tf.reduce_sum(y_true * tf.math.log(y_predict+epsilon))
    return loss

3. mean_square_error

均方误差多用于回归问题的损失函数，其数学表达式如下：
$\frac{1}{n}\sum_{i=0}^{n} (\hat y_i - y_i)^2$

def mean_square_error(y_true,y_predict):
    loss = tf.reduce_mean((y_predict - y_true)**2)
    return loss

4. 自定义函数

自定义损失函数：

$l oss$ 能正确衡量预测值与目标值之间的距离。
$l oss$ 是一个标量，且 $\ge 0$ 。
$l oss$ 尽可能的与问题匹配。

对于损失函数的理解，应该重点关注损失函数的效用，不要拘泥于形式，要结合具体问题具体分析，对问题的深入理解才能更好的设计出有效的损失函数。

联系邮箱：antarm@outlook.com

ufy

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
深度学习之损失函数

深度学习之损失函数
复制链接

扫一扫

专栏目录

深度学习之损失函数

损失函数

1. binary_crossentropy

2. category_crossentropy

3. mean_square_error

4. 自定义函数

“相关推荐”对你有帮助么？