本次学习是基于上海科学智能研究院和天池的“第二届世界科学智能大赛地球科学赛道:AI极端降水预报”开展的实践学习,本次学习已经接近尾声,现在来记录一下习得的上分技巧。
- 数据
从数据角度出发,可以观察到所提供的数据大部分是接近0的值,小部分为极值,这部分极值是设计模型的关键。在使用数据时,我们要想办法提高极值数据对于模型的贡献,降低接近0 的这一部分值对于模型的贡献。
- 模型
本次赛题与时间序列的相关性较强,需要着重考虑,可以参考对时间序列特征有良好提取能力的模型。
- 损失函数
根据之前提到的数据问题,模型需要对高值敏感,加更大的惩罚项;对低值不敏感,输出的低值对模型的贡献应相对来说小,可以尝试根据输入值处在不同区间加不同权重的nn.MSELoss。