pytorch教程龙曲良36-40

最新推荐文章于 2023-05-06 08:29:46 发布

sueong

最新推荐文章于 2023-05-06 08:29:46 发布

阅读量366

点赞数 1

分类专栏： pytorch

本文链接：https://blog.csdn.net/sueong/article/details/116769086

版权

pytorch 专栏收录该内容

23 篇文章 10 订阅

订阅专栏

36函数极小值优化实战

四个解都是0所以都是全局最小值
在这里插入图片描述

PLOT

在这里插入图片描述

 #最小值0取的值（x,y）是（3,2）x初始化是0
#最小值0取的值（x,y）是（3.584428，-1.8484=126）x初始化是4

import os
os.environ['KMP_DUPLICATE_LIB_OK'] = 'TRUE'

import torch
import numpy as np
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
#f(x,y)=(x**2+y-11)**2+(x+y**2-7)**2

def f(x):
    return (x[0]**2+x[1]-11)**2+(x[0]+x[1]**2-7)**2

x=np.arange(-6,6,0.1)
y=np.arange(-6,6,0.1)
print('x,y range:',x.shape,y.shape)
X,Y=np.meshgrid(x,y)
print('X,Y maps:',X.shape,Y.shape)#x,y两个平面对应位置上的点一一对应组成map
Z=f([X,Y])

fig=plt.figure('f')
ax=fig.gca(projection='3d')
ax.plot_surface(X,Y,Z)
ax.view_init(60,-30)
ax.set_xlabel('x')
ax.set_ylabel('y')
plt.show()

#现在是优化 pred对x的偏导 不是loss对w的偏导

x=torch.tensor([0.,0.],requires_grad=True)
optimizer=torch.optim.Adam([x],lr=1e-3)
#完成对x[0]'=x[0]-lr*pred对x[0]的偏导
#完成对x[1]'=x[1]-lr*pred对x[1]的偏导


for step in  range(20000):
    pred=f(x)

    optimizer.zero_grad()#反向传播累乘前先清零
    pred.backward()#生成x[0] x[1]的梯度信息
    optimizer.step()#更新一次x[0]' x[1]' 直到找到x[0]* x[1]*最合适的 满足最小值

    if step%2000==0:
        print('step {} ：x= {}，f(x)={}'.format(step,x.tolist(),pred.item()))
'''
x,y range: (120,) (120,)
X,Y maps: (120, 120) (120, 120)
step 0 ：x= [0.0009999999310821295, 0.0009999999310821295]，f(x)=170.0
step 2000 ：x= [2.3331806659698486, 1.9540694952011108]，f(x)=13.730916023254395
step 4000 ：x= [2.9820079803466797, 2.0270984172821045]，f(x)=0.014858869835734367
step 6000 ：x= [2.999983549118042, 2.0000221729278564]，f(x)=1.1074007488787174e-08
step 8000 ：x= [2.9999938011169434, 2.0000083446502686]，f(x)=1.5572823031106964e-09
step 10000 ：x= [2.999997854232788, 2.000002861022949]，f(x)=1.8189894035458565e-10
step 12000 ：x= [2.9999992847442627, 2.0000009536743164]，f(x)=1.6370904631912708e-11
step 14000 ：x= [2.999999761581421, 2.000000238418579]，f(x)=1.8189894035458565e-12
step 16000 ：x= [3.0, 2.0]，f(x)=0.0
step 18000 ：x= [3.0, 2.0]，f(x)=0.0

Process finished with exit code 0





'''

在这里插入图片描述

37logistics regression

regression一般是指的连续的值
转换成分类问题加个sigmoid函数

在这里插入图片描述

classification：
目标：放大accuracy 越准确越好
pθ(y|x) 给出x得到y的条件概率,模型学到的概率
pr(y|x) 给出x得到y的条件概率,真实的概率
现在要法1缩小这二者的差距或者法2缩小二者的分布

为什么不能直接放大acc 在这里插入图片描述
logistics regression：叫logistics是因为用了sigmoid函数，regression其实有争议，其实本质上是个classification问题，当使用MSE时可以理解成regression，但是用cross entropy就是classification问题

在这里插入图片描述

在这里插入图片描述
多分类问题
经过softmax激活后，原来的输出大的变得更大
2->0.7，1->0.2 本来2/1=2倍现在0.7/0.2=3.5倍

38交叉熵

cross entropy

在这里插入图片描述

entropy
不确定性惊喜信息少

在这里插入图片描述

最后一个最稳定所以熵很低，0.999的那个中奖
第一个熵最高不稳定会随机一个人中奖，都是0.25
熵最小，这个时候最有秩序；而被打乱的时候，熵开始增大，直到最后一片混乱，熵变成最大：
在这里插入图片描述
Dkl是kl Divergence 两个分布的重叠程度，数值越大重叠越少，数值越小重叠越大，如果pq完全相似则，Dkl就是0。

p=q时，Dkl=0，再有如果采用one-hot（分类问题多用这个），这样entropy=1log1=0，所以越稳定，所以可以用cross entropy衡量出来时
在这里插入图片描述

二分类问题的优化目标是-（ylog(p)+(1-y)log(1-p)）
在这里插入图片描述
使用cross entropy优化H下降速度更快，优化更快，pθ（预测分布）更接近pr（真实分布），比使用MSE更快

为啥不用MSE
1梯度消失
2梯度下降慢
3但是有时候用MSE效果更好因为MSE梯度求导简单
（pred-y）**2 求导得2（pred-y）
在这里插入图片描述

注意cross entropy在pytorch中已经把softmax和log打包在一起，所以要传入的是logits
ce=softmax+log+nll_loss
在这里插入图片描述

39多分类问题实战

在这里插入图片描述

step是训练完一个batch的step
epoch是训练完整个数据集


'''
Train Epoch：0 [0/60000 (0%)]	 Loss:2.496092
Train Epoch：0 [20000/60000 (33%)]	 Loss:1.293757
Train Epoch：0 [40000/60000 (67%)]	 Loss:0.846965
Train Epoch：1 [0/60000 (0%)]	 Loss:0.627197
Train Epoch：1 [20000/60000 (33%)]	 Loss:0.580098
Train Epoch：1 [40000/60000 (67%)]	 Loss:0.486529
Train Epoch：2 [0/60000 (0%)]	 Loss:0.495914
Train Epoch：2 [20000/60000 (33%)]	 Loss:0.588657
Train Epoch：2 [40000/60000 (67%)]	 Loss:0.446819
Train Epoch：3 [0/60000 (0%)]	 Loss:0.447987
Train Epoch：3 [20000/60000 (33%)]	 Loss:0.384017
Train Epoch：3 [40000/60000 (67%)]	 Loss:0.367968
Train Epoch：4 [0/60000 (0%)]	 Loss:0.477522
Train Epoch：4 [20000/60000 (33%)]	 Loss:0.592025
Train Epoch：4 [40000/60000 (67%)]	 Loss:0.540704
Train Epoch：5 [0/60000 (0%)]	 Loss:0.448472
Train Epoch：5 [20000/60000 (33%)]	 Loss:0.445303
Train Epoch：5 [40000/60000 (67%)]	 Loss:0.489408
Train Epoch：6 [0/60000 (0%)]	 Loss:0.352725
Train Epoch：6 [20000/60000 (33%)]	 Loss:0.431580
Train Epoch：6 [40000/60000 (67%)]	 Loss:0.474489
Train Epoch：7 [0/60000 (0%)]	 Loss:0.550202
Train Epoch：7 [20000/60000 (33%)]	 Loss:0.415313
Train Epoch：7 [40000/60000 (67%)]	 Loss:0.369599
Train Epoch：8 [0/60000 (0%)]	 Loss:0.500460
Train Epoch：8 [20000/60000 (33%)]	 Loss:0.388243
Train Epoch：8 [40000/60000 (67%)]	 Loss:0.404500
Train Epoch：9 [0/60000 (0%)]	 Loss:0.397505
Train Epoch：9 [20000/60000 (33%)]	 Loss:0.351531
Train Epoch：9 [40000/60000 (67%)]	 Loss:0.443983

 test set:average loss：0.0003,Accuracy:8606/10000 (86)


Process finished with exit code 0

'''

40全连接层

多层的全连接层
nn.Linear

layer=nn.Linear(784,200)

在这里插入图片描述
大部分情况用relu 像素重建的时候才用sigmoid

autograd后实行自动向后求导

nn.Sequenltial可以添加任何继承nn.Module的类
class M

import torch
import torch.nn as nn

class MLP(nn.Module):
    def __init__(self):
        super(MLP,self).__init__()

        self.model=nn.Sequential(#sequential串联起来
            nn.Linear(784,200),
            nn.ReLU(inplace=True),
            nn.Linear(200, 200),
            nn.ReLU(inplace=True),
            nn.Linear(200,10),
            nn.ReLU(inplace=True),
        )
        def forward(self,x):
            x=self.model(x)

        return x

nn.ReLu是类api，需要先实例化再调用，w，b是内部参数不能介入只能使用.parameter来访问而不是私自访问
F.relu，function-api，可以自己管理w，b这些tensor，提供gpu操作
一般优先nn.ReLu

在这里插入图片描述
这里不用初始化w和b 因为w和b已经被Linear管理了，没办法直接暴露出来初始化，这个接口有自己的初始化方法已经够用了

# -*- codeing = utf-8 -*-
# @Time :2021/5/14 21:06
# @Author:sueong
# @File:ll.py
# @Software:PyCharm
import torch
import torch.nn as nn
from torch import optim

# 超参数
from torchvision import datasets, transforms

batch_size = 200
learning_rate = 0.01
epochs = 10

# 获取训练数据
train_db = datasets.MNIST('../data', train=True, download=True,  # train=True则得到的是训练集
                          transform=transforms.Compose([  # transform进行数据预处理
                              transforms.ToTensor(),  # 转成Tensor类型的数据
                              transforms.Normalize((0.1307,), (0.3081,))  # 进行数据标准化(减去均值除以方差)
                          ]))

# DataLoader把训练数据分成多个小组，此函数每次抛出一组数据。直至把所有的数据都抛出。就是做一个数据的初始化
train_loader = torch.utils.data.DataLoader(train_db, batch_size=batch_size, shuffle=True)

# 获取测试数据
test_db = datasets.MNIST('../data', train=False,
                         transform=transforms.Compose([
                             transforms.ToTensor(),
                             transforms.Normalize((0.1307,), (0.3081,))
                         ]))

test_loader = torch.utils.data.DataLoader(test_db, batch_size=batch_size, shuffle=True)


class MLP(nn.Module):
    def __init__(self):
        super(MLP,self).__init__()

        self.model=nn.Sequential(#sequential串联起来
            nn.Linear(784,200),
            nn.ReLU(inplace=True),
            nn.Linear(200, 200),
            nn.ReLU(inplace=True),
            nn.Linear(200,10),
            nn.ReLU(inplace=True),
        )
    def forward(self,x):
        x = self.model(x)
        return x



#Train

net=MLP()#网络结构 就是foward函数
optimizer=optim.SGD(net.parameters(),lr=learning_rate)#使用nn.Module可以直接代替之前[w1,b1,w2,b2.。。]
criteon=nn.CrossEntropyLoss()

for epoch in range(epochs):
    for batch_ind,(data,target) in enumerate(train_loader):
        data=data.view(-1,28*28)

        logits=net(data)#这不要再加softmax logits就是pred
        loss=criteon(logits,target)#求loss

        optimizer.zero_grad()
        loss.backward()

        optimizer.step()

        if batch_ind%100==0:
            print('Train Epoch：{} [{}/{} ({:.0f}%)]\t Loss:{:.6f}'.format(
                epoch,batch_ind*len(data),len(train_loader.dataset),
                100.* batch_ind/len(train_loader),loss.item()
            ))

test_loss=0
correct=0

for data,target in test_loader:
    data=data.view(-1,28*28)#第一个维度保持不变写-1
    logits=net(data)
    test_loss+=criteon(logits,target).item()

    pred=logits.data.max(1)[1]#因为
    correct+=pred.eq(target.data).sum()

test_loss/=len(train_loader.dataset)
print('\n test set:average loss：{:.4f},Accuracy:{}/{} ({:.0f}%)\n'.format(
    test_loss,correct,len(test_loader.dataset),
    100.*correct/len(test_loader.dataset)
))

'''
F:\anaconda\envs\pytorch\python.exe F:/pythonProject1/pythonProject3/ll.py
Train Epoch：0 [0/60000 (0%)]	 Loss:2.315060
Train Epoch：0 [20000/60000 (33%)]	 Loss:2.069264
Train Epoch：0 [40000/60000 (67%)]	 Loss:1.572258
Train Epoch：1 [0/60000 (0%)]	 Loss:1.299846
Train Epoch：1 [20000/60000 (33%)]	 Loss:1.100520
Train Epoch：1 [40000/60000 (67%)]	 Loss:1.019639
Train Epoch：2 [0/60000 (0%)]	 Loss:0.945382
Train Epoch：2 [20000/60000 (33%)]	 Loss:0.895289
Train Epoch：2 [40000/60000 (67%)]	 Loss:0.877365
Train Epoch：3 [0/60000 (0%)]	 Loss:0.826702
Train Epoch：3 [20000/60000 (33%)]	 Loss:0.817137
Train Epoch：3 [40000/60000 (67%)]	 Loss:0.667326
Train Epoch：4 [0/60000 (0%)]	 Loss:0.688401
Train Epoch：4 [20000/60000 (33%)]	 Loss:0.692957
Train Epoch：4 [40000/60000 (67%)]	 Loss:0.569227
Train Epoch：5 [0/60000 (0%)]	 Loss:0.667585
Train Epoch：5 [20000/60000 (33%)]	 Loss:0.588931
Train Epoch：5 [40000/60000 (67%)]	 Loss:0.531139
Train Epoch：6 [0/60000 (0%)]	 Loss:0.632487
Train Epoch：6 [20000/60000 (33%)]	 Loss:0.499388
Train Epoch：6 [40000/60000 (67%)]	 Loss:0.691728
Train Epoch：7 [0/60000 (0%)]	 Loss:0.435568
Train Epoch：7 [20000/60000 (33%)]	 Loss:0.600809
Train Epoch：7 [40000/60000 (67%)]	 Loss:0.525673
Train Epoch：8 [0/60000 (0%)]	 Loss:0.519194
Train Epoch：8 [20000/60000 (33%)]	 Loss:0.540513
Train Epoch：8 [40000/60000 (67%)]	 Loss:0.438987
Train Epoch：9 [0/60000 (0%)]	 Loss:0.427629
Train Epoch：9 [20000/60000 (33%)]	 Loss:0.409045
Train Epoch：9 [40000/60000 (67%)]	 Loss:0.514155

 test set:average loss：0.0004,Accuracy:8286/10000 (83%)


Process finished with exit code 0


'''

sueong

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
pytorch教程龙曲良36-40

36函数极小值优化实战四个解都是0所以都是全局最小值PLOT #最小值0取的值（x,y）是（3,2）x初始化是0#最小值0取的值（x,y）是（3.584428，-1.8484=126）x初始化是4import osos.environ['KMP_DUPLICATE_LIB_OK'] = 'TRUE'import torchimport numpy as npimport matplotlib.pyplot as pltfrom mpl_toolkits.mplot3d impo
复制链接

扫一扫