阿里天池—2022江苏气象预测AI算法挑战赛

摘要

This is a meteorological forecasting competition being held by Ali Tianchi. The contestants need to predict future meteorological data based on past meteorological data; the meteorological data is given in the form of pictures, including radar echo map, rainfall map, average wind image, so it is necessary to use the technology of image information extraction; the initial idea is to obtain three different Encodings and Decoders through pre-training through the MAE model. These three Encodings will understand the meaning of the image data they are responsible for and keep the three Encodings The parameters remain unchanged, and an optimized Transformer model is combined behind them. The Transformer model will realize the function of completing time series prediction, and the predicted data will be finally decoded into the meteorological data in the picture format through the Decoder in MAE, so as to achieve image recognition and processing. For the purpose of time series prediction, the MAE-Encoder-Transformer-MAE-Decoder model was discovered.
这是阿里天池正在进行的一个气象预测的比赛,选手需要根据过去的气象数据预测未来的气象数据;气象数据是以图片的形式给出的,其中包括雷达回波图、降雨量图、平均风图,故需要用到图像信息提取的技术;初步想法是通过MAE模型,预训练得到三个不同的Encoding和Decoder,这三个Encoding将会明白各自负责的图片数据含义,保持这三个Encoding的参数不变,在其后面接一个优化后的Transformer模型,Transformer模型将实现时序预测的功能,将预测的数据,最后再通过MAE中的Decoder解码为图片格式的气象数据,以达到图像识别加时序预测的目的,于是便有了MAE-Encoder-Transformer-MAE-Decoder模型。


一、数据分析

数据是图片形式的,空间分辨率为1KM,时间分辨率为6分钟,且图片按时间顺序命名,如下图:
在这里插入图片描述
数据为雷达回波(Radar)、降水(Precip)和平均风(Wind)三类。使用说明:
在训练集Train提供的所有数据中,既包含强天气过程(Radar或Precip或Wind有较高的数值),也有好天(Radar或Precip或Wind数值很低),赛题组从中挑出了2万+次有强天气发生的过程并以案例的形式呈现在对应的Train.csv中供选手参照,其中每行的41列为一次案例,各行之间相互独立,每个案例以序号.png的形式列出。以截取自Train.csv的图1为例,第一行有41列,对应为任一天中任意4小时时段内的逐6分钟图片序列(共41张),前21张图片为过去2小时的数据(例如00时—02时),后21张图片为后2小时数据(例如02时06分—04时)。该序号同时适用于Radar、Precip和Wind,可据此从原始数据文件中索引找到相应图片并进行模型构建,对未来2小时(20张图片)的Radar、Precip和Wind进行预测;
在这里插入图片描述
要用过去20张图片的气象数据,去预测未来20张气象数据图片,显然,这个时间序列是比较长的,所以需要我们的模型能够很好的理解气象图片的数据含义,才有可能得到比较好的效果

二、MAE简介

MAE是一个用来做图像识别的预训练模型,他是Encoder-Decoder架构,它是做法是通过遮掩掉一部分的图像数据,让模型根据遮掩的图片还原出全部的图片,以训练出一个能够有效提取图片信息的模型。
在这里插入图片描述

三、Transformer简介

Transformer也是Encoder-Decoder架构,在Encoder端会通过位置编码将位置信息加入到输入数据,再将数据映射到不同空间,用多头注意力让模型抓住重要信息,抛弃无用信息。在Decoder端,对Encoder的数据进行解码,得到预测数据,达到时序预测的效果。
在这里插入图片描述

四、模型搭建(还未写…)

  • 2
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 5
    评论
天池智慧交通预测挑战赛是由阿里巴巴举办的比赛,旨在通过数据分析和建模预测来优化城市交通系统。参赛者需要利用提供的交通数据集,通过构建模型并进行预测,提供交通出行时间的准确性和效率。这个比赛要求参赛者具备数据分析、建模预测和时间序列预测等相关技能。 参赛者可以先进行准备工作,包括数据集的分割和预处理,然后根据时间序列预测的思路,利用已有的历史数据进行训练模型,并预测未来的交通出行时间。可以根据过去的几个时间点的交通状况预测未来一个时间段的交通状况,进而生成整个月的序列。 具体的建模预测步骤包括:数据集的准备和预处理、特征构建、模型的选择和训练、时间序列预测等。在建模预测过程中,可以使用各种机器学习算法和时间序列预测方法,如回归模型、神经网络、ARIMA模型等,来进行交通出行时间的预测。通过不断调整模型的参数和进行交叉验证,优化模型的性能和准确性。 总之,天池智慧交通预测挑战赛是一个利用数据分析和建模预测的比赛,旨在优化城市交通系统。参赛者可以通过对历史数据的分析和预测预测未来的交通出行时间,提高交通的准确性和效率。同时,参赛者需要具备数据分析、建模预测和时间序列预测等相关技能。<span class="em">1</span><span class="em">2</span><span class="em">3</span><span class="em">4</span>

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值