Pytorch Intro

最新推荐文章于 2024-07-16 22:49:14 发布

吴骄骄骄骄骄骄骄骄～～

最新推荐文章于 2024-07-16 22:49:14 发布

阅读量52

点赞数

分类专栏： pytorch基础入门文章标签： pytorch 深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_67036766/article/details/129244637

版权

pytorch基础入门专栏收录该内容

4 篇文章 0 订阅

订阅专栏

激活函数与Loss

包括MSE和交叉熵

MSE

不需要开平方
函数F.mse_loss(torch.ones(1),x*w) : 第一个是预测的值，第二个是标签的值

函数 torch.autograd.grad(mse,[w]) : 接收两个参数，第一个是目标函数y，在这里是mse，第二个参数是目标函数的自变量，在这里是w

下面这个例子中y = 1
在这里插入图片描述
必须要对w信息进行更新，告诉pytorch w需要求导
也可以在初始化时就是建立需要求导的信息如

w = torch.full([1],2,requires_grad = True)  # 告诉w需要求导信息

mse_loss()会建立动态图
mse.backward()会自动求解所有能求解的梯度值

这里补充一些范数的基本概念

softmax 激活函数 soft version of max

在这里插入图片描述
所有概率值之和为1

单层感知机的推导

在这里插入图片描述

梯度更新的过程

在经过复杂的公式推导之后，直接看推导结果。从结果感性的理解梯度更新的过程。
如下面两图所示，当进行一次运算之后，已知的量包括：所有节点的输出，所有权值w在本轮运算的值
在经过之前的公式推导之后可以知道，这一层的梯度信息是可以通过这一层的输出与下一层的梯度信息相乘得到。而输出层的梯度信息是根据输出结果O与标签值t得到的。那么既然最后一层的梯度信息已知，每一层的输出也已知，就可以从后往前一步一步的推导得到每一层的梯度信息，从而更新本轮的所有参数的梯度信息。
在这里插入图片描述

一个例子

如下图：在这里optimizer的操作就是实现使用求出的梯度信息来更新变量在这里插入图片描述
backwards方法更新梯度信息
后面再使用step操作

熵交叉熵

熵表示的就是混乱程度混乱程度越高熵越高所蕴含的可能及信息就越多
对于01分布熵为0
交叉熵可以拆分为熵和KL散度，KL散度就是描述两个分布的离散程度。两份高斯分布完全重合，其KL散度就为0，因为完全不离散。
如果使用one-hot编码，那么交叉熵中的熵就为0，求交叉熵就等于求两个分布的KL散度。
在这里插入图片描述
二分类的优化目标

总体的计算流程

灰色部分直接打包成模块使用就是corss_entropy = softmax + log + nll_loss

吴骄骄骄骄骄骄骄骄～～

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Pytorch Intro

从而更新本轮的所有参数的梯度信息。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。