Datawhale AI 夏令营 笔记
初窥门径
本次参加的是一个关于降水预测的深度学习夏令营。在本次课程中, 学习到对机器学习、深度学习的初步认识,对常用深度学习框架pytorch的认识, 对极端降水预测有了初步了解。
降水预测
降水预测模型, 是一类时间序列相关的问题, 是一个有标注的监督学习的回归任务, 是使用在时间序列上前一部分的数据来预测后一部分的数据。通俗来说, 时间序列预测模型目的在构建一个全时段可用的时间序列函数, 根据输入可以精准的得到目的的输出, 比如本次赛题中的降水预测模型.
那么我们如何去搭建一个预测模型呢?
- 首先需要做数据处理, 如果打开下载后的数据文件可以看到, 里面有feature特征文件和groundtruth真值文件, 因此首先要建立对应feature和groundtruth数据之间的关系, 可以从baseline里看到构建方法.
- 接着, 如果把降水预测模型看作一个函数, 我们需要尽可能找到一个最好拟合降水预测过程的函数. 这时, 对数据有着良好拟合效果的深度学习就派上了用场:通过pytorch, 我们可以搭建神经网络, 尽可能去好的在我们的数据上做拟合, 通过一系列尝试我们就得到了拟合效果最好的模型.
- 最后, 需要在测试数据上验证模型的效果.
通过这三步, 一个简单的预测模型就可以被搭建起来。
跑baseline中的问题,未完待续
魔塔需要绑定阿里云才能领到免费的GPU额度,一开始启动的时候一直启动不了,目测是当前在线使用的人太多了。需要重新启动几次。
一路畅通,最后的task1的分数为:
还有比较大的改进空间。