首先感谢Datawhale提供的夏令营机会,经过10天的学习,从baseline的搭建到进阶上分技巧,最终成绩夏令营内本赛道前10,赛事官网初赛排名50/1418。
简单的写一个复盘吧,算是对自己这十天的学习的一个交代。
赛题分析:这是一个时序分析任务,需要利用给定的数据去预测未来72小时的极端降水,对数据进行修正。
数据集:数据集给出的是.nc格式的文件,需要使用xarray库去对数据进行处理,xarray库是用于处理高维数据的,这在气象领域很常用。
数据分析与预处理:读取数据集,分析数据之间的联系,数据查看,数据归一化,异常值处理。
模型搭建:使用PyTorch,进行基本的模型架构的搭建,学习了PyTorch的相关知识,深入浅出PyTorch学习。
模型选择:CNN,LSTM,Transformer等,根据任务和数据特征选择适合的模型,不同模型一般适合于不同的任务。
训练与调参优化:划分训练集和验证集,模型参数初始化,学习率,优化器,训练周期的选择,正则化,损失函数的构造等
数据可视化:利用可视化工具,进行数据的可视化;训练过程中,可以画图直观展示损失函数的变化。
这期的复盘就到这里,后面还有两期AI夏令营,继续参加,这个暑假收获满满。
加油!前路漫漫,道阻且长,学无止尽!