【李宏毅2021机器学习深度学习——作业1 Regression】COVID-19 Cases Prediction 记录(双过strong baseline)

写在前面

[视频学习-bilibili] | [课程主页——sample code & slide] | [ML2021学习笔记]

预备知识(常用包):
matplotlib 绘图
pandas 数据处理
numpy 数据处理

别人的修改,重点看数据分析部分
完成这个作业的收获:机器学习调优步骤:数据 – 网络 – 超参数

数据 - 数据处理,清洗,分析相关性,选取相关性大的特征
网络
超参数

修改样例代码的地方(双过srong baseline)

  1. 特征选取:feats = [40, 41, 42, 43, 57, 58, 59, 60, 61, 75, 76, 77, 78, 79, 92]
  2. 数据集随机划分,且比例为0.1train_indices, valid_indices = train_test_split([i for i in range(data.shape[0])], test_size=0.1, random_state=1)-------------train_test_splitsklearn包下: from sklearn.model_selection import train_test_split
  3. L2正则化:weight_decay: 1e-3

实验记录()

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

收获:

15个特征选取:涉及数据处理,相关性分析【等待学习中…】
RMES:loss曲线更平滑
归一化:是整体(训练集 + 验证集)的归一化,不是每个数据集单独的归一化
L1正则化:【等待学习中…】
L2正则化:这里选取L2,且λ = 1e-3,参考李沐老师视频-12 权重衰退【动手学深度学习v2】
k-fold:k-fold在数据集小情况下,应该是个好方法【等待 实践中…】
数据集随机划分

改进想法:

  1. 数据清洗?
  2. k-fold验证?
  3. ensemble?

一些参考:

[李宏毅深度学习作业笔记]HW1 Covid-19(Regression))

HW1 COVID-19 Cases Prediction (Regression)

pai4451 add hw1

主要参考:Hung_Yi_Lee_ML_2021/hw/hw1/hw1_code.ipynb

  • 2
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值