PyTorch:Loss函数的梯度

Jerusalem*

已于 2024-03-04 21:41:34 修改

阅读量153

点赞数 1

文章标签： pytorch 深度学习人工智能

于 2024-03-04 21:05:22 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2205_75881260/article/details/136462414

版权

本文介绍了在PyTorch中使用Loss函数（如MSE）的实例，以及softmax函数的定义、性质和梯度计算方法。通过计算softmax概率及其导数，展示了如何在分类问题中处理概率和梯度更新。

摘要由CSDN通过智能技术生成

1、Loss函数的表达式

loss=torch.norm(y-pred,2).pow(2)

示例:

print("示例一：")
x=torch.ones(1)
print(x)#x=tensor([1.])
w=torch.full([1],2)
w.requires_grad_()
print(w)
#torch.ones(1)是tensor([1.]),是predict,y=x*w+b,其中b=0,x=tensor([1]),w=tensor([1])
#loss=(y-pred)**2
mse=torch.autograd.grad(torch.ones(1),x*w)
print(mse)

3、softmax函数

①函数值属于0～1之间，所有函数值的和是1

②存在金字塔效应

③分类问题中概率问题

④pi/aj求导结果：

i=j时，求导结果是pj(1-pj).

i不等于j时，求导结果是-pi*pj

#softmax函数
  #值的范围在0～1之间，而且所有值求和结果是1

a=torch.rand(3)
a.requires_grad_()#表示需要grad信息
print(a)#tensor([0.9307, 0.0915, 0.8436], requires_grad=True)

#将a的值转换成概率，数值越大，概率越大
p=F.softmax(a,dim=0)
print(p)#tensor([0.4258, 0.1840, 0.3903], grad_fn=<SoftmaxBackward0>)

#对p中的第二个变量，i=1
#j=0时，i!=j,-0.4258*0.1840=-0.0783
#j=1时，i=j,0.1840*(1-0.1840)=0.1501
#j=2时，i!=j,-0.1840*0.3903=-0.0718
print(torch.autograd.grad(p[1],[a],retain_graph=True))#(tensor([-0.0783,  0.1501, -0.0718]),)

#对p中的第三个变量,i=2
#j=0时，i!=j,-0.3903*0.4258=-0.1662
#j=1时，i!=j,-0.3903*0.1840=-0.0718
#j=2时，i=j,0.3903*(1-0.3903)=0.2380
print(torch.autograd.grad(p[2],[a]))                  #(tensor([-0.1662, -0.0718,  0.2380]),)

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
PyTorch:Loss函数的梯度

1、Loss函数的表达式。
复制链接

扫一扫

Jerusalem* CSDN认证博客专家 CSDN认证企业博客

码龄2年

28: 原创

133万+: 周排名

9万+: 总排名

5900: 访问

: 等级

375: 积分

61: 粉丝

93: 获赞

8: 评论

32: 收藏

私信

关注

热门文章

最新评论

基于resnet的花卉识别神经网络
ha_lydms: 这篇博客真是我心灵的驿站，让我觉得自己有了一个可以倾诉的对象。
PyTorch: 高阶操作
CSDN-Ada助手: 恭喜你发布了第20篇博客！看到你对PyTorch高阶操作的深入探讨，我感到非常欣慰。希望你能继续保持创作的热情，不断分享你的学习和实践经验。或许下一步可以考虑写一些关于PyTorch在实际项目中的应用案例，这样可以让更多读者受益。期待你的更多精彩内容！
PyTorch: 属性统计
CSDN-Ada助手: “恭喜您发布了第19篇博客，标题为‘PyTorch: 属性统计’，看来您对PyTorch有着深入的研究和理解。希望您能继续保持创作的热情，分享更多有价值的内容。或许下一步可以考虑写一些实际应用案例或者深入探讨一些PyTorch的高级技术，这样可以让更多人受益。期待您的下一篇作品。”
CNN卷积神经网络
CSDN-Ada助手: 恭喜您撰写了第11篇博客《CNN卷积神经网络》，阐述了卷积神经网络的相关知识，内容丰富深入。希望您能继续保持创作的热情和积极性，不断提升自身的写作水平。下一步建议可以考虑深入探讨CNN在图像识别、自然语言处理等领域的应用，为读者带来更多实用价值。期待您更多精彩的作品！
实战四、openCv基于dlib包实现人脸检测
CSDN-Ada助手: 恭喜你写了第9篇博客！你对于使用openCv基于dlib包实现人脸检测的实战经验很有见解。接下来，我建议你可以尝试探索一些更具挑战性的实战项目，比如基于人脸检测的情感分析或者人脸识别技术的应用。相信你一定能够取得更多的成就！加油！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。