深度学习框架Pytorch——学习笔记(七)常用损失函数和神经网络优化方法，激活函数简述

最新推荐文章于 2024-02-24 20:56:52 发布

AN ZE

最新推荐文章于 2024-02-24 20:56:52 发布

阅读量808

点赞数

分类专栏： pytorch 深度学习文章标签： pytorch

本文链接：https://blog.csdn.net/qq_39341555/article/details/90446562

版权

深度学习同时被 2 个专栏收录

12 篇文章 1 订阅

订阅专栏

pytorch

9 篇文章 2 订阅

订阅专栏

深度学习框架Pytorch——学习笔记(七)常用损失函数和神经网络优化方法，激活函数简述

优化方法参考地址 https://www.leiphone.com/news/201706/e0PuNeEzaXWsMPZX.html

网络的可学习参数 net.parameters()

for parameters in net.parameters():
	print(parameters)
使用 net.named_parameters()  可同时返回可学习参数和名称

loss损失函数在nn中常用的都包含，是类的方式，先定义后使用
优化器在torch.optim中，传入 net.parameters() 网络的参数

常用的损失函数

(x,y)L1loss

nn.L1Loss()
x与y的差的绝对值

在这里插入图片描述

(x,y)均方损失

nn.MSELoss()
x与y的差的平方和

在这里插入图片描述

用于多分类的负对数似然损失

nn.NLLLoss()

在这里插入图片描述

用于多分类的交叉熵损失

nn.CrassEntropyLoss()
logsoftmax与MLLloss的结合

在这里插入图片描述

(x,y)二进制交叉熵

nn.BCELoss()
用前需要在前面加上sigmoid函数

在这里插入图片描述

三种优化算法

优化器的作用就是用来更新梯度的。
SGD随机梯度下降	
RMSprop快速梯度下降
Adam自动

SGD随机梯度下降算法，带有动量的可选参数

optimizer = torch.optim.SGD(model.parameters(), lr=0.1, momentum=0.9)

RMSprop算法，可以减小某些维度梯度更新波动较大的情况，使其梯度下降的速度变得更快

optimizer = torch.optim.RMSprop(model.parameters(), lr=0.01, alpha=0.99)

Adam 自动更新梯度，一般使用默认值即可

optimizer = torch.optim.Adam(model.parameters())

常见激活函数

神经网络无非是每层的矩阵相乘，其关系是线性的。无论怎么改变，其得到的信息没有太大的差距。所以需要激活函数引入非线性因素，使得神经网络可以任意逼近任何非线性函数，增加了模型泛化的特性。

sigmoid函数（放弃）

在这里插入图片描述
输出在（0,1），把输入变换为0到1之间的输出。
需要进行指数运算，比较慢，且不利于权重优化。
目前基本上只有在做二元分类（0，1）时的输出层才会使用。

tanh函数（放弃）

在这里插入图片描述
输出区间是在(-1,1)之间，以0为中心。
随着Relu的出现所有的隐藏层基本上都使用relu来作为激活函数了

ReLU （最常用）

在这里插入图片描述
a=max(0, x) 导数大于0时1，小于0时0。
当输入是负数的时候，ReLU是完全不被激活的.
但是实际的运用中，该缺陷的影响不是很大。

Leaky ReLU函数 (不一定好用)

在这里插入图片描述
a=max(zx, x) z=0.01
理论上来讲，Leaky ReLU有ReLU的所有优点，但是在实际操作当中，并没有完全证明Leaky ReLU总是好于ReLU。

AN ZE

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

深度学习框架Pytorch——学习笔记(七)常用损失函数和神经网络优化方法，激活函数简述

深度学习框架Pytorch——学习笔记(七)常用损失函数和神经网络优化方法，激活函数简述

常用的损失函数

(x,y)L1loss

(x,y)均方损失

用于多分类的负对数似然损失

用于多分类的交叉熵损失

(x,y)二进制交叉熵

三种优化算法

常见激活函数

sigmoid函数 （放弃）

tanh函数 （放弃）

ReLU （最常用）

Leaky ReLU函数 (不一定好用)

sigmoid函数（放弃）

tanh函数（放弃）