PyTorch:Loss函数的梯度

本文介绍了在PyTorch中使用Loss函数(如MSE)的实例,以及softmax函数的定义、性质和梯度计算方法。通过计算softmax概率及其导数,展示了如何在分类问题中处理概率和梯度更新。
摘要由CSDN通过智能技术生成

1、Loss函数的表达式

loss=torch.norm(y-pred,2).pow(2)

示例:

print("示例一:")
x=torch.ones(1)
print(x)#x=tensor([1.])
w=torch.full([1],2)
w.requires_grad_()
print(w)
#torch.ones(1)是tensor([1.]),是predict,y=x*w+b,其中b=0,x=tensor([1]),w=tensor([1])
#loss=(y-pred)**2
mse=torch.autograd.grad(torch.ones(1),x*w)
print(mse)

3、softmax函数

①函数值属于0~1之间,所有函数值的和是1

②存在金字塔效应

③分类问题中概率问题

④pi/aj求导结果:

i=j时,求导结果是pj(1-pj).

i不等于j时,求导结果是-pi*pj

#softmax函数
  #值的范围在0~1之间,而且所有值求和结果是1

a=torch.rand(3)
a.requires_grad_()#表示需要grad信息
print(a)#tensor([0.9307, 0.0915, 0.8436], requires_grad=True)

#将a的值转换成概率,数值越大,概率越大
p=F.softmax(a,dim=0)
print(p)#tensor([0.4258, 0.1840, 0.3903], grad_fn=<SoftmaxBackward0>)

#对p中的第二个变量,i=1
#j=0时,i!=j,-0.4258*0.1840=-0.0783
#j=1时,i=j,0.1840*(1-0.1840)=0.1501
#j=2时,i!=j,-0.1840*0.3903=-0.0718
print(torch.autograd.grad(p[1],[a],retain_graph=True))#(tensor([-0.0783,  0.1501, -0.0718]),)

#对p中的第三个变量,i=2
#j=0时,i!=j,-0.3903*0.4258=-0.1662
#j=1时,i!=j,-0.3903*0.1840=-0.0718
#j=2时,i=j,0.3903*(1-0.3903)=0.2380
print(torch.autograd.grad(p[2],[a]))                  #(tensor([-0.1662, -0.0718,  0.2380]),)

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值