关于李宏毅ML2021、2022HW3双Boss baseline的一步一步尝试实验记录与总结(一）

xihuanafengxx

已于 2022-07-14 15:21:45 修改

阅读量716

点赞数 1

分类专栏：关于李宏毅ML2021、2022的实验记录。文章标签：深度学习神经网络 cnn 机器学习

于 2022-07-14 15:16:03 首次发布

本文链接：https://blog.csdn.net/weixin_49327342/article/details/125783597

版权

关于李宏毅ML2021、2022的实验记录。专栏收录该内容

5 篇文章 5 订阅

订阅专栏

本文介绍了作者初次尝试深度学习的实践，使用了基础的CNN模型，数据集仅包含3080个标注样本，进行了基本的尺寸调整作为数据增强。模型训练中遇到过拟合问题，由于数据量小和模型简单，导致学习到的特征噪声较大。作者期望通过改进数据处理来提升模型性能，并寻求指导如何更有效地分析训练结果和调参。

摘要由CSDN通过智能技术生成

这是第一篇，每一篇都会说一些尝试

文章结构

1、Base_line

步入正题，首先放出训练的图。
在这里插入图片描述

2、条件预设

A、数据使用情况

1、完全使用labeled的数据集，没有采用unlabeled的数据集，数据量为train_set：3080，valid_set：660

2、 Augment只改变了一下输入尺寸。没有使用其他任何数据增强策略

# Date_Augment
train_tfm = transforms.Compose([
    transforms.Resize((128, 128)),
    transforms.ToTensor()
])

test_tfm = transforms.Compose([
    transforms.Resize((128, 128)),
    transforms.ToTensor()
])

B、模型架构

1、三个卷积层

class CNN(nn.Module):
    def __init__(self):
        super(CNN, self).__init__()
        # input image [b, 3, 128, 128]
        self.cnn_layer = nn.Sequential(
            nn.Conv2d(3, 64, 3, 1, 1),
            nn.BatchNorm2d(64),
            nn.ReLU(),
            nn.MaxPool2d(2, 2, 0),

            nn.Conv2d(64, 128, 3, 1, 1),
            nn.BatchNorm2d(128),
            nn.ReLU(),
            nn.MaxPool2d(2, 2, 0),

            nn.Conv2d(128, 256, 3, 1, 1),
            nn.BatchNorm2d(256),
            nn.ReLU(),
            nn.MaxPool2d(4, 4, 0),
        )

        self.fc_layers = nn.Sequential(
            nn.Linear(256 * 8 * 8, 256),
            nn.ReLU(),
            nn.Linear(256, 256),
            nn.ReLU(),
            nn.Linear(256, 11)
        )
    def forward(self, x):
        # input image [b, 3, 128, 128]
        x = self.cnn_layer(x)
        # 转为全链接层
        x = x.flatten(1)

        x = self.fc_layers(x)

        return x

C、训练参数设置

Batch_size_Data = 32

criterion = nn.CrossEntropyLoss()

optimizer = torch.optim.Adam(model.parameters(), lr=0.0003, weight_decay=1e-5)

3、总结

在这里插入图片描述

模型没有做任何数据处理、训练的模型也是十分得简单，所以训练出来的效果非常的差也很正常，且这次没有很好的记录下来一些数据。过拟合十分早，且数据集太少，导致学出来的噪声特征太大了。且也存在模型太简单的原因，没办法学出更好的数据。下一步准备稍微处理一下数据，看看变化。

希望各位大佬能够提点简易，最近才接触到炼丹，啥也不会，也不知道该怎么去分析这些结果，调参也不行，就知道莽数据集和模型结构。希望各位大佬能够教教我如何去更加可视化的看训练出来的数据，如何去分析数据集及训练出来的结果。

xihuanafengxx

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
关于李宏毅ML2021、2022HW3双Boss baseline的一步一步尝试实验记录与总结(一）

全网最低BaseLine
复制链接

扫一扫

专栏目录