机器学习李宏毅2020hw3可运行

import os
import numpy as np
import cv2
import torch
import torch.nn as nn
import torchvision.transforms as transforms
from torch.utils.data import DataLoader, Dataset
import time

#读取图片
def readfile(path,label):
    #label确定训练集或测试集
    image_dir=sorted(os.listdir(path))
    x=np.zeros((len(image_dir),128,128,3),dtype=np.uint8)
    y=np.zeros((len(image_dir)),dtype=np.uint8)

    for i,file in enumerate(image_dir):
        img=cv2.imread(os.path.join(path,file))
        #统一图片大小
        x[i,:,:]=cv2.resize(img,(128,128))

        if label:
            y[i]=int(file.split('_')[0])
            #以下划线分开,取前面的标签
    if label:
        return x,y
    else:
        return x

workspace_dir='/home/lizheng/Study/yolov5-5.0/food-11'
print('Reading data')
train_x,train_y=readfile(os.path.join(workspace_dir,'training'),True)
print('Size of training data={}'.format(len(train_x)))
val_x,val_y=readfile(os.path.join(workspace_dir,'validation'),True)
print('Size of validation data={}'.format(len(val_x)))
test_x=readfile(os.path.join(workspace_dir,'testing'),False)
print('Size of Testing data={}'.format(len(test_x)))

#用transforms.Compose将函数打包为新的函数,用来数据增强
training_transform=transforms.Compose([
    transforms.ToPILImage(),
    transforms.RandomHorizontalFlip(),#随机反转图片
    transforms.RandomRotation(15.0),#随机旋转图片
    transforms.ToTensor()
])
#testing 不需要数据增强
test_transform=transforms.Compose([
    transforms.ToPILImage(),
    transforms.ToTensor(),
])
#Dataset把数据打包成[ [X], Y ],X的数据形式为 图片数 * 3(彩色三通道) * 128*128(像素),每个X对应一个Y。
# 例如train_set[0] 为 [  [第一张图的数据],第一张图的分类编号],
# train_set[1] 为 [  [第二张图的数据],第二张图的分类编号] 。
#DataLoader把打包的数据分每128个图片为一个batch,一个batch的形式为[ [X], Y],
#X为 128(图片数) * 3(彩色三通道) * 128*128(像素), Y 也有128个编号。[   [X(128个)],Y(128个)   ]每组X对应组Y。

class ImgDataset(Dataset):
    def __init__(self,x,y=None,transform=None):
        self.x=x
        self.y=y
        if y is not None:
            self.y=torch.LongTensor(y)
        self.transform=transform

    def __len__(self):
        return len(self.x)

    def __getitem__(self,index):
        #传入一个x,y给X,Y,每个X有128个图片,组成一个batch,Y同理
        X=self.x[index]
        if self.transform is not None:
            X=self.transform(X)
        if self.y is not None:
            Y=self.y[index]
            return X,Y
        else:
            return X

class classifier(nn.Module):
    def __init__(self):
        super(classifier,self).__init__()
#torch.nn.Conv2d(in_channels,out_channels,kernel_size,stride,padding)
#torch.nn.MaxPool2d(kernel_size,stride,padding)
        self.cnn=nn.Sequential(
            nn.Conv2d(3,64,3,1,1),#输出[64,128,128]
            nn.BatchNorm2d(64),
            nn.ReLU(),
            nn.MaxPool2d(2,2,0),  #输出[64,64,64]

            nn.Conv2d(64,128,3,1,1),  #输出[128,64,64]
            nn.BatchNorm2d(128),
            nn.ReLU(),
            nn.MaxPool2d(2,2,0),  #输出[128,32,32]

            nn.Conv2d(128, 256, 3, 1, 1),  # 输出[256,32,32]
            nn.BatchNorm2d(256),
            nn.ReLU(),
            nn.MaxPool2d(2, 2, 0),      # 输出[256,16,16]

            nn.Conv2d(256, 512, 3, 1, 1),  # 输出[512,16,16]
            nn.BatchNorm2d(512),
            nn.ReLU(),
            nn.MaxPool2d(2, 2, 0),       # 输出[512,8,8]

            nn.Conv2d(512, 512, 3, 1, 1),  # 输出[512,8,8]
            nn.BatchNorm2d(512),
            nn.ReLU(),
            nn.MaxPool2d(2, 2, 0) # 输出[512,4,4]
        )

        #全连接的前向传播神经网络
        self.fc=nn.Sequential(
            nn.Linear(512*4*4,1024),
            nn.ReLU(),
            nn.Linear(1024,512),
            nn.ReLU(),
            nn.Linear(512,11),#输出可能的11个结果的概率

        )
    def forward(self,x):
        out=self.cnn(x) #out时cnn的输出128*[512,4,4].传进的x以一个batch为单位
        out=out.view(out.size()[0],-1)#[512,4,4]变为一维,维度变为[128行,512*4*4列]
        return self.fc(out)

#Dataloader
batch_size=128
#将数据打包
train_set=ImgDataset(train_x,train_y,training_transform)
val_set=ImgDataset(val_x,val_y,test_transform)
print(train_set.x)
print(train_set.y)
#DataLoader把打包的数据分每128个图片为一个batch ,一个batch的形式为[ [X],Y],X为128*3*128*128
train_loader=DataLoader(train_set,batch_size=batch_size,shuffle=True)#是否在每个epoch开始时重新排序
val_loader=DataLoader(val_set,batch_size=batch_size,shuffle=False)

#因为nn.Module的__call__函数中调用了forward()函数,那么__call__作用是什么呢?
# 它允许我们把一个实例当作对象一样来调用,举个简单的例子吧:
model=classifier().cuda()#设定GPU,并自动调用forward函数
loss=nn.CrossEntropyLoss()#设定损失函数
optimizer=torch.optim.Adam(model.parameters(),lr=0.001)#设定优化器
num_epoch=30

for epoch in range(num_epoch):
    epoch_start_time=time.time()
    train_acc=0.0
    train_loss=0.0
    val_acc=0.0
    val_loss=0.0

    model.train()
    for i,data in enumerate(train_loader):#一个一个取batch
        optimizer.zero_grad()#用optimizer将模型参数的梯度gradient归零
        train_pred=model(data[0].cuda())#利用model得到预测的概率分布,实际是调用模型的forward函数
        # data[0] = x, data[1] = y
        batch_loss=loss(train_pred,data[1].cuda())
        batch_loss.backward()#BP计算所有的gradient
        optimizer.step()#更新参数
        # .data表示将Variable中的Tensor取出来
        # train_pred是(batch_size,11)的数据,np.argmax()返回最大值的索引,axis=1则是对行进行(取一行中列值最大的列),返回的索引正好就对应了标签,
        # 然后和y真实标签比较,则可得到分类正确的数量
        #sum获得一个batch中正确的数量,而后加入到train_acc中
        train_acc+=np.sum(np.argmax(train_pred.cpu().data.numpy(),axis=1)==data[1].numpy())
        train_loss=batch_loss.item()## 张量中只有一个值就可以使用item()方法读取


    model.eval()
    with torch.no_grad():
        for i,data in enumerate(val_loader):
            val_pred=model(data[0].cuda())
            batch_loss=loss(val_pred,data[1].cuda())

            val_acc+=np.sum(np.argmax(val_pred.cpu().data.numpy(),axis=1)==data[1].numpy())
    val_loss=batch_loss.item()

    #输出结果:
    print('[%03d/%03d] %2.2f sec(s) Train Acc: %3.6f Loss: %3.6f|Val Acc:%3.6f loss: %3.6f' %
          (epoch+1,num_epoch,time.time()-epoch_start_time,train_acc/train_set.__len__(),
          train_loss/train_set.__len__(),val_acc/val_set.__len__(),
          val_loss/val_set.__len__()))
    torch.cuda.empty_cache()

train_val_x=np.concatenate((train_x,val_x),axis=0)#将训练集和验证集合并,增强训练效果
train_val_y=np.concatenate((train_y,val_y),axis=0)
train_val_set=ImgDataset(train_val_x,train_val_y,training_transform)#生成训练集
train_val_loader=DataLoader(train_val_set,batch_size=batch_size,shuffle=True)#生成批训练集

model_best=classifier().cuda()
loss=nn.CrossEntropyLoss()
optimizer=torch.optim.Adam(model_best.parameters(),lr=0.001)

num_epoch=30

for epoch in range(num_epoch):
    epoch_start_time=time.time()
    train_acc=0.0
    train_loss=0.0

    model_best.train()
    for i,data in enumerate(train_val_loader):
        optimizer.zero_grad()
        train_pred=model_best(data[0].cuda())
        batch_loss=loss(train_pred,data[1].cuda())
        batch_loss.backward()
        optimizer.step()

        train_acc+=np.sum(np.argmax(train_pred.cpu().data.numpy(),axis=1)==data[1].numpy())
        train_loss+=batch_loss.item()

    print('[%03d/%03d] %2.2f sec(s) Train Acc: %3.6f Loss: %3.6f' %
          (epoch+1,num_epoch,time.time()-epoch_start_time,
           train_acc/train_val_set.__len__(),train_loss/train_val_set.__len__()))

test_set=ImgDataset(test_x,transform=test_transform)
test_loader=DataLoader(test_set,batch_size=batch_size,shuffle=False)

model_best.eval()
prediction=[]

with torch.no_grad():
    for i,data in enumerate(test_loader):
        test_pred=model_best(data.cuda())
        #最大值为预测的标签
        test_label=np.argmax(test_pred.cpu().data.numpy(),axis=1)
        for y in test_label:
            prediction.append(y)
            
with open('prediction.csv','w') as f:
    f.write('Id,Category\n')
    for i,pred in enumerate(prediction):
        f.write('{},{}\n'.format(i,pred))
torch.cuda.empty_cache()

在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
李宏毅的2020机器学习笔记中,有一个关于注意力机制(Attention)的部分。这部分内容主要介绍了生成模型(Generation)、注意力(Attention)、生成的技巧(Tips for Generation)以及指针网络(Pointer Network)。在生成模型中,主要讲述了如何生成一个有结构的对象。接下来介绍了注意力机制,包括一些有趣的技术,比如图片生成句子等。在生成的技巧部分,提到了一些新的技术以及可能遇到的问题和偏差,并给出了相应的解决方案。最后,稍微提到了强化学习。其中还提到了在输出"machine"这个单词时,只需要关注"机器"这个部分,而不必考虑输入中的"学习"这个部分。这样可以得到更好的结果。另外,还提到了关于产生"ei"的方法,其中有研究应用了连续动态模型自注意力(Self-attention)来学习位置编码的方法。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [2020李宏毅机器学习笔记-Condition Generation by RNN&Attention](https://blog.csdn.net/zn961018/article/details/117593813)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *3* [李宏毅机器学习学习笔记:Self-attention](https://blog.csdn.net/weixin_44455827/article/details/128094176)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值