李宏毅2022机器学习hw3

这篇博客记录了作者在李宏毅机器学习课程HW3中进行的图像分类任务,包括简单线性模型、中等基线、强基线和Boss基线的实现。通过数据增强、残差网络、预训练参数、交叉验证和ensemble策略提高模型性能,最终在Boss基线上取得超过0.88的准确率。
摘要由CSDN通过智能技术生成

目录

Machine Learning HW3

任务

数据下载

结果

改进方法

2.1 Simple line (acc>0.50099)

2.2 Medium Baseline (acc>0.73207)       

2.3 Strong Baseline (acc>0.81872)

模型设计,采用残差神经网络。

2.4 Boss Baseline (acc>0.88446)

        使用预训练参数,进一步增强数据。

        使用交叉验证。

        使用esemble,综合几个模型的结果

总结


Machine Learning HW3

任务

        图像分类

 

数据下载


百度网盘:

链接:https://pan.baidu.com/s/1gEiw4nIYDA4puMIhqBI5Og?pwd=pwyl 
提取码:pwyl

结果


全过strong baselin,public score与bossline差0.2

 

改进方法


2.1 Simple line (acc>0.50099)


        运行课程上给的基础代码

2.2 Medium Baseline (acc>0.73207)
       

         对数据集进行数据增强,并训练更长的时间,这里的图像变换,一是可以增强模型的鲁棒性,二是可以用于进一步扩充数据集,使得我们的训练集得到扩充。

test_tfm = transforms.Compose([
    transforms.Resize((128, 128)),
    transforms.ToTensor(),
])

# 对于训练图片做处理,数据增强,常用的几种有效数据增强方法:
train_tfm = transforms.Compose([
    # Resize the image into a fixed shape (height = width = 128)
    transforms.Resize((128, 128)),

    # You may add some transforms here.
    transforms.RandomHorizontalFlip(p=0.5),  # 50%的概率水平翻转
    transforms.RandomVerticalFlip(p=0.5),  # 50%的概率垂直翻转
    transforms.RandomCrop(128, padding=10),#填充剪裁
    # transforms.RandomGrayscale(p=0.1)  #根据概率转灰度channel=1,CNN中in_channel=3,不可行
    transforms.ColorJitter(brightness=0.5, con
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

梦想的小鱼

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值