11月15日,谷歌旗下著名AI研究机构Deepmind在官网宣布,开源天气大模型GraphCast,并公布了论文。
据悉,GraphCast可以在1分钟内,精准预测而来全球10天的天气情况,同时可以提前预警大暴雨、大风雪、洪水、高温、超级台风等极端恶劣天气情况,并且优于同类模型HRES。
例如,在温度预报上,GraphCast的误差比HRES低10-25%;在海平面气压预报上误差降低了约15%。
GraphCast主要提供了GraphCast、GraphCast_small和GraphCast_operational三种不同分辨率和训练数据的模型,以满足不同组织的需求。目前,GraphCast模型已经被ECMWF等气象机构使用。
开源地址:https://github.com/google-deepmind/graphcast
论文地址:https://www.science.org/doi/10.1126/science.adi2336
在线demo:https://charts.ecmwf.int/products/graphcast_medium-mslp-wind850
谷歌表示,GraphCast之所以比HRES等模型提供更精准的预报,是因为使用了新的图神经网络(GNNs)技术。这种技术通过学习天气系统中的复杂空间交互,来模拟天气的变化。相比之下,传统数值模型像HRES依靠人工设计的程序来模拟天气,存在很大的局限性。
GraphCast简单介绍
GraphCast是一个端到端的深度学习系统,包含编码器、处理器和解码器三个模块。编码器,将输入数据从原始的纬度-经度网格映射到一个多层次的网格上;处理器,在网格上进行多步信息传递学习天气演变规律;解码器,再把网格映射回经纬度图上,输出预报结果。
GraphCast的创新点提出了多尺度网格表示,将常规的六角形网格层级叠加,既包含近程也包含远程连接,信息可以高效传播。
相比卷积网络只建模局部,Transformer的计算成本太高,该设计使模型既可模拟天气系统中的长程依赖,也保持计算高效。
GraphCast训练数据
研究人员使用了欧洲中期天气预报中ERA再分析数据集(1979-2020年)来训练GraphCast,目标是预测未来3天的227个面部和大气变量,损失函数为预测值和真实值的均方误差。为模拟连续预报,模型输出反馈为下一时步输入,实现自回归训练。
在GraphCast整个端到端训练过程中,无需人工提取特征或设计方法,只需1分钟就能预测未来10天天气情况。而传统的数值天气预报依靠人工积累的物理知识,需要昂贵的超算集群,计算时间长达1小时。
值得一提的是,尽管训练数据中不包含任何物理设计,但GraphCast依然学会了许多基本的大气动力学机制,如罗斯贝波传播等,这些都是从数据中自动学习,而非人为设计。
GraphCast实验数据
研究人员在2018年独立气象数据上全面评估了GraphCast和HRES的预报结果。
500hPa高度预报:GraphCast的RMSE(衡量模型预测精度的常用指标)平均比HRES降低15%,达到显著水平,超过HRES的预报真值相关度也有显著提升。
对流层温度预报:GraphCast的RMSE降低11%,积分水汽输送预报RMSE降低10%以上。
表面变量预报:对2米温度、10米风等变量,GraphCast在短期预报阶段同样优于HRES。
热带气旋路径预报:GraphCast的中位数预报误差比HRES降低约15%。
极端天气预报:GraphCast可以更准确预测极端高温等强对流天气。
不过谷歌指出,GraphCast也存在一些限制,例如,当前只能预测部分变量,对云、辐射过程的建模还不够充分。此外,由于训练数据的局限,对平流层以上的大气预报准确率还不能超过HRES。
未来,会继续提升GraphCast,使它可以预测更多变量,并扩展预测时效。
本文素材来源谷歌官网,如有侵权请联系删除