Nature: 基于机器学习的概率天气模型-GenCast
期刊:Nature
英文题目:Probabilistic weather forecasting with machine learning
中文题目:基于机器学习的概率天气预报
作者(前三):Ilan Price, Alvaro Sanchez-Gonzalez, Ferran Alet
发表日期:2024年12月04日
摘要:
天气预报从根本上来说具有不确定性,无论是向公众发布危险天气的警告,还是规划可再生能源的使用,因此预测可能发生的天气情景范围对于重要决策至关重要。传统上,天气预报基于数值天气预报 (NWP),它依赖于基于物理学的大气模拟。基于机器学习(ML) 的天气预报 (MLWP)的最新进展产生了基于ML的天气模型,其预测误差比单一 NWP模拟要小。但是,这些进展主要集中在单一的确定性预测上,这些预测无法反映不确定性和估计风险。总体而言,MLWP 的准确性和可靠性仍然低于最先进的NWP集合预报。GenCast是一种机器学习天气预报方法,基于数十年的再分析数据进行训练,其技巧和速度比世界上顶级的中期天气预报、ENS(欧洲中期天气预报中心的集合预报)更高。可在8分钟内生成一组随机的15天全球预报,步长为12小时,经纬度分辨率为0.25°,涵盖80多个地表和大气变量。它在我们评估的1,320 个目标中,有 97.2% 的目标显示出比 ENS 更稳健的预测,并且能更好地预测极端天气、热带气旋轨迹和风力发电。这项工作有助于开启实用天气预报的下一篇章,其中关键的天气相关决策将更加准确和高效。
研究背景:
传统天气预报基于数值天气预报(NWP)算法,该算法近似求解模拟大气动力学的方程。确定性数值天气预报方法将当前的天气估计映射到对未来天气随时间变化的预测。为了对未来不同天气情景的概率分布进行建模,气象机构越来越依赖集合预报,集合预报会生成多个基于NWP的预报,每个预报都会模拟一个可能的情景。欧洲中期天气预报中心(ECMWF)的ENS是ECMWF更广泛的综合预报系统中最先进的基于NWP的集合预报,并将在未来纳入其确定性预报HRES。
基于机器学习(ML)的天气预报(MLWP)的最新进展表明,对于非概率预报,基于ML模型天气预测比NWP提供了更高的精度和效率。这些方法不是预测单个天气轨迹或轨迹分布,而是主要侧重于预测可能轨迹的平均值,较少强调量化与预测相关的不确定性。研究人员的这项工作介绍了MLWP方法GenCast,它的性能明显优于顶级运营集成NWP模型ENS。证明了GenCast可以生成真实的单个天气轨迹的集合,提供比ENS更好的边际预报分布和更好的联合预报分布。
GenCast模型:
GenCast是一种概率天气模型,可生成分辨率为0.25°的全球15天集合预报,比ECMWF的顶级业务集合系统ENS更准确。在Cloud TPUv5设备上生成单个15天的GenCast预测大约需要8分钟,并且可以并行生成一组预测。
GenCast以当前和之前的天气状态为条件,对未来天气状态Xt+1的条件概率分布P(Xt+1 | Xt,Xt?1) 进行建模。长度为T的预测轨迹X1:T通过以初始状态和先前状态 (X0, X?1)为条件进行建模,并分解连续状态上的联合分布,每个都是自回归采样的。
全球天气状态X的表示由0.25°等角经纬度网格上13个垂直气压级别的6个地表变量和6个大气变量组成。预测范围为15天,连续步骤 t和t + 1之间有12小时,因此T = 30。使用X分析来训练GenCast,X代表从观测中推断出的天气状态的最佳估计。
GenCast 是一种条件扩散模型,它是一种生成式 ML 方法,可以对复杂数据的概率分布进行建模并生成新样本。扩散模型是生成式 AI 领域中许多最新自然图像、声音和视频建模进展的基础。扩散模型通过迭代细化过程进行工作。未来大气状态Xt+1是通过迭代地细化初始化为纯噪声的候选状态而产生的,以前两个大气状态 (Xt,Xt?1) 为条件。图1中的蓝色框显示了如何从初始条件生成第一个预测步骤以及如何自回归生成完整轨迹X1:T。由于预测中的每个时间步骤都用噪声初始化,因此可以使用不同的噪声样本重复该过程以生成轨迹集合。
图1 GenCast 如何生成预测的示意图
代表性案例研究
作为一个说明性的例子,图2b-d和h-j展示了GenCast的预报样本。而图2n-q提供了一个示例,说明它们如何被用于重要的下游应用中,比如预测热带气旋的路径。
台风海贝思,2019年损失最惨重的热带气旋。当在台风海贝思登陆前7天初始化时,GenCast的预测轨迹表现出高度的不确定性,涵盖了各种可能的情况。提前时间越短,GenCast关于气旋路径的不确定性就越低,反映出对登陆时间和位置的信心更大。
图2 预报和热带气旋路径的可视化
研究结果1:熟练的边缘预测分布
(1)集合预报技巧
CRPS是衡量概率预报技能的标准指标。如图3所示,在1,320个变量、交付时间和垂直水平组合中的 97.2%(以及交付时间大于36小时的目标的99.6%)上的结果,GenCast的预测明显比ENS更加熟练(P < 0.05)。GenCast最大的改进通常是将表面变量以及较高压力水平下的温度和比湿度的交付时间缩短至约3-5天,为此CRPS技能得分提高了10%至30%。
图3所示,GenCast的集合平均RMSE在96%的目标上与ENS一样好或更好,在78%的目标上明显更好(P < 0.05)。
(2)集合预报校准
根据验证方法,GenCast展现出良好的校准性能,与ENS所展现的类似。GenCast的分布/技巧得分通常略低于但非常接近1(如图4b-f),并且往往具有平整的排名直方图。相比之下,GenCast-Perturbed始终过于自信,显示出的分布/技巧得分远低于1,并且排名直方图呈现U形。
(3)局部地表极端值
图4g和图4h展示了预测2米气温和10米风速是否会超过相对于气候学99.99百分位的结果。GenCast(蓝色曲线)在所有成本/损失比率下,以及在1天、5天和7天的领先时间(分别对应实线、虚线和点划线)中,都显著(P < 0.05)比ENS(黑色曲线)有更好的REV(相对经济价值)。GenCast还提供了更好的极端事件其他水平(其他超过百分位数)的预测,以及对其他变量的预测,包括极端低温和低平均海平面气压。
图3 GenCast显示的总体平均RMSE与ENS一样好或更好
图4 GenCast熟练且校准良好的边缘预测分布
研究结果2:熟练的联合预测分布
(1)空间聚合评估
在所有5,400个汇总验证目标中(涵盖每个变量、级别、提前时间和空间尺度),GenCast在平均汇总CRPS上优于ENS的比例为98.1%,在最大汇总CRPS上的比例为97.6%,且在更大的尺度上相对性能有所提高(图5和6)。GenCast-Perturbed在平均汇总CRPS上与ENS相当或更好,占比为86%,但在最大汇总CRPS上仅为50%,并且在94%和97%的目标上都比GenCast差。这表明GenCast在所有地表和大气变量上比ENS和GenCast-Perturbed更好地捕捉了空间依赖性。
(2)区域风力发电预测
GenCast在2天以内的预报时间里,其CRPS(连续排名概率分数)比ENS高出约20%,在2天到4天的预报时间里高出10-20%,并且保持统计显著(P < 0.05)的改进直到7天。这是一个比GenCast-Perturbed所提供的改进要大得多的进步。结果表明GenCast 提供了更熟练的风力预报,可以捕获现实世界风电场站点的联合空间结构,表明风能管理和使用的潜在价值。
(3)热带气旋
GenCast的集合平均路径始终比ENS的更有技巧。平均而言,GenCast在1天到4天的预测中提供了12小时的准确度优势(图7b),在12小时到3.5天的预报时间中误差显著(P < 0.05)更低。GenCast的轨迹概率预报优于ENS,在所有成本/损失比率下实现了更好的REV。这表明GenCast可以在关于何时以及如何准备应对热带气旋的决策中提供重要价值。
图5 GenCast集成捕获空间依赖性结构(平均池化 CRPS)
图6 GenCast 集成捕获空间依赖性结构(最大池化 CRPS)
图7 GenCast在区域风力发电和热带气旋路径预测方面优于 ENS
a.不同规模汇集区域中风电场地点44总风电的相对CRPS总和。b.系综平均气旋轨迹的位置误差。c.1天、3天和5天提前期的热带气旋路径概率预报REV。所有图均显示GenCast和ENS4的比较
研究结论:
研究结果表明,基于MLWP的概率天气预报比顶级的基于NWP的集合预报ECMWF的ENS更熟练、生成速度更快。GenCast在概率天气模型的三个关键要求方面取得了成功:
(1)GenCast 生成的是具有真实功率谱的清晰单个天气轨迹集合,而不是条件均值等汇总统计数据集。
(2)GenCast 的边际预报分布(即针对给定地点和时间的预报)经过精心校准,可提供比 ENS 更精准的预报,包括对极端事件的更准确预报。
(3)GenCast 在几项需要捕捉联合分布中的空间和时间依赖性的评估中表现优于 ENS:汇集评估、区域风电预测和热带气旋路径预测。
研究意义:
综合来看,该研究结果在天气预报领域开辟了一个新的前沿。并且,可以在广泛的应用场景中提供更高的准确性、效率和可访问性。该项工作证明了尖端的生成式人工智能方法能够以足够的准确性和可靠性捕捉高维且复杂的时间动态分布,从而支持关键应用中有效的决策制定。
对我们开展工作的启示:
GenCast模型的成功展示了机器学习技术在处理复杂、高维度气象数据方面的巨大潜力。这鼓励科研工作者进一步探索和开发基于机器学习的方法,以提高天气预报的准确性和效率。这项研究涉及气象学、机器学习、高性能计算等多个领域,表明在解决复杂的科学问题时,跨学科合作是必不可少的。
这项研究不仅推动了天气预报技术的发展,也为科研工作者提供了新的研究路径和方法论,特别是在如何利用先进的机器学习技术来解决传统科学问题方面。
文献来源:https://doi.org/10.1038/s41586-024-08252-9
声明:以上中文翻译为译者个人对于文章的概略理解,论文传递的准确信息请参照英文原文。
撰稿:罗镕基
初审:任杰
审核:杜军
终审:鲁鹏