【李宏毅2021机器学习深度学习——作业1 Regression】COVID-19 Cases Prediction 记录（双过strong baseline）

深度学习入门咨询

已于 2022-01-23 18:02:16 修改

阅读量2.8k

点赞数 3

于 2021-12-01 17:19:02 首次发布

本文链接：https://blog.csdn.net/weixin_43154149/article/details/121635271

版权

深度学习

文章目录

写在前面

写在前面

[视频学习-bilibili] | [课程主页——sample code & slide] | [ML2021学习笔记]

预备知识（常用包）：
matplotlib 绘图
pandas 数据处理
numpy 数据处理

别人的修改，重点看数据分析部分
完成这个作业的收获：机器学习调优步骤：数据 – 网络 – 超参数

数据 - 数据处理，清洗，分析相关性，选取相关性大的特征
网络
超参数

修改样例代码的地方（双过srong baseline）

特征选取:feats = [40, 41, 42, 43, 57, 58, 59, 60, 61, 75, 76, 77, 78, 79, 92]
数据集随机划分，且比例为0.1： train_indices, valid_indices = train_test_split([i for i in range(data.shape[0])], test_size=0.1, random_state=1)-------------train_test_split在sklearn包下： from sklearn.model_selection import train_test_split
L2正则化：weight_decay: 1e-3

实验记录（）

在这里插入图片描述

收获：

15个特征选取：涉及数据处理，相关性分析【等待学习中…】
RMES：loss曲线更平滑
归一化：是整体（训练集 + 验证集）的归一化，不是每个数据集单独的归一化
L1正则化：【等待学习中…】
L2正则化：这里选取L2，且λ = 1e-3,参考李沐老师视频-12 权重衰退【动手学深度学习v2】
k-fold：k-fold在数据集小情况下，应该是个好方法【等待实践中…】
数据集随机划分

改进想法：

数据清洗？
k-fold验证？
ensemble?

一些参考：

[李宏毅深度学习作业笔记]HW1 Covid-19(Regression))

HW1 COVID-19 Cases Prediction (Regression)

pai4451 add hw1

主要参考：Hung_Yi_Lee_ML_2021/hw/hw1/hw1_code.ipynb

深度学习入门咨询

关注

3
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
【李宏毅2021机器学习深度学习——作业1 Regression】COVID-19 Cases Prediction 记录（双过strong baseline）

写在前面[视频学习-bilibili] | [课程主页——sample code & slide] | [ML2021学习笔记]预备知识（常用包）：matplotlib 绘图pandas 数据处理numpy 数据处理别人的修改，完成这个作业的收获：机器学习调优步骤：数据 – 网络 – 超参数数据 - 数据处理，清洗，分析相关性，去除不相干的特征网络超参数文章目录写在前面sample code 重新组织1. 引包2. 准备数据3. 定义网络及超参数4. 训练5. 绘制结果，保存模
复制链接

扫一扫