深度学习与图像识别:原理与实践笔记Day_09

最新推荐文章于 2024-09-17 11:41:04 发布

努力卷

最新推荐文章于 2024-09-17 11:41:04 发布

阅读量210

点赞数

文章标签：深度学习神经网络人工智能

本文链接：https://blog.csdn.net/qq786558544/article/details/120827106

版权

本文详细介绍了深度学习中常用的两种损失函数——均方误差和交叉熵误差。通过实例展示了它们在神经网络分类任务中的应用，解释了如何计算以及它们在不同情况下的表现。均方误差衡量的是预测值与真实值之间的平均距离，而交叉熵误差在Softmax激活函数下更适用于多分类问题，能够更好地反映模型预测的准确性。

摘要由CSDN通过智能技术生成

一、损失函数

1.均方误差

均方误差是各数据偏离真实值的距离平方和的平均数，也即误差平方和的平均数，用σ表示。

$Loss = \frac{\sum_{0}^{n}(x_i-x_i{}')^2}{n}$

这里 $x_i$ 表示的是神经网络的输出， $x_i{}'$ 表示的是真实值，i表示每个数据。

用Python代码实现，具体如下：

def mean_squared_error(p,y):
    return np.sum((p-y)**2)/y.shape[0]

动物分类的例子，我们将猫份为类1，狗分为类2，小鸡分类为3，如果不属于任何一类就分为类0。假设我们在这里输入了一张猫的照片，其对应的真是标签是0 1 0 0(ont-hot编码形式):

$y=\begin{pmatrix} 0 \\ 1 \\ 0 \\ 0 \end{pmatrix}$ , $y_precict = \begin{pmatrix} 0.3 \\ 0.2 \\ 0.1 \\ 0.4 \end{pmatrix}$

通过代码来看：

import numpy as np
y = np.array([0,1,0,0])  # y的真实标签
p = np.array([0.3,0.2,0.1,0.4]) #通过Softmax得到的概率值
def mean_squared_error(p,y):
    return np.sum((p-y)**2)/y.shape[0]

print(mean_squared_error(p,y))

运行结果：

如果分类的类别是正确的，则输出的是0.05500000000014

import numpy as np
y = np.array([0,1,0,0])  # y的真实标签
p = np.array([0.2,0.6,0.1,0.1]) #通过Softmax得到的概率值
def mean_squared_error(p,y):
    return np.sum((p-y)**2)/y.shape[0]

print(mean_squared_error(p,y))

运行结果：

第一个例子中，我们输入的图片是猫，但是神经网络认为是鸡，损失函数的输出约为0.23；

第二个例子中，我们输入的图片是猫，神经网络也认为是猫，损失函数的输出约为0.055.

可以看出第二个例子的损失函数较小，意味着其与真实值之间的误差较小。

2.交叉熵误差

同样的例子，在使用Softmax层时，对应的目标值y以及训练结束前某次输出的概率值y_predict分别为：

$y=\begin{pmatrix} 0 \\ 1 \\ 0 \\ 0 \end{pmatrix}$ , $y_precict = \begin{pmatrix} 0.3 \\ 0.2 \\ 0.1 \\ 0.4 \end{pmatrix}$

Softmax使用的损失函数为交叉熵，其中C代表类别数量：

$Loss = - \sum_{j=1}^{C=4}y_jlog(y_predict_j)$

在训练过程中，我们的目标是最小化Loss的值，y已经是ont-hot类型了，我们输入的图片是猫，所以我们知道y1=y3=y4=0,y2=1,所以带入Loss函数中可以得到：

$Loss = - y_2log(y_predict_2)$

def cross_entropy_error(p,y):
    return np.sum(-y*np.log(p))

p代表预测值；y表示真实值

努力卷

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

深度学习与图像识别:原理与实践 笔记Day_09

一、损失函数

1.均方误差

2.交叉熵误差

深度学习与图像识别:原理与实践笔记Day_09