💥💥💞💞欢迎来到本博客❤️❤️💥💥
🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。
⛳️座右铭:行百里者,半于九十。
📋📋📋本文目录如下:🎁🎁🎁
目录
💥1 概述
文献来源:
摘要:
我们提出了一个新的统计模型,捕捉了空间领域中极端事件之间的条件依赖关系。这个模型可以用来描述特定地区的灾难性事件,如地震、洪水或飓风,特别是用于预测未监测站点的极端值。提出的模型如下。假设每个位置的区块最大值遵循广义极值(GEV)分布。空间依赖性以两种互补的方式建模。GEV参数通过薄膜模型相互耦合,这是一种特定类型的高斯图模型,通常用作平滑先验。另一方面,极端事件通过一个Copula高斯图模型相互耦合,其精度矩阵对应于(广义)薄膜模型。然后,我们为所提出的模型推导了推断和插值算法。该方法在合成数据以及与墨西哥湾飓风相关的真实数据上进行了验证。数值结果表明,它可以准确地描述空间领域中的极端事件,并可可靠地在任意站点插值极端值。
极端事件,如洪水、飓风和地震,通常对我们的社会产生毁灭性影响。统计模型可以帮助评估此类极端事件的可能性[1],以及空间范围内极端事件之间的依赖关系[1],[2],[3]。这些模型可能有助于量化某些基础设施和设施暴露于极端条件下的风险。
极值理论控制着关于极端顺序统计量的渐近分布的行为[1]。费舍尔-蒂皮特-格涅登科(FTG)定理,通常被称为极值理论中的第一个定理,断言独立同分布的单变量样本的区块最大值(例如,月度或年度最大值)收敛于广义极值(GEV)分布[4]。在空间领域中建模极端事件是非常有趣的,因为它们可以用来描述某些地区的灾难性事件(例如,墨西哥湾的极端海浪)。在空间领域中建模极端事件最具挑战性的问题之一是在约束边际为GEV分布(受FTG定理激发)的同时完全捕捉极端事件的空间依赖性。
到目前为止,关于建模高维空间极端事件的文献相当有限。接下来,我们进行简要回顾。在[2]中,提出了一种计算极端事件成对空间依赖性的程序,即,在一个站点超过阈值的条件下,另一个站点超过阈值的概率[3]。另一种方法是,Naveau等人[5]通过变程的概念量化了成对空间依赖性。然而,这两种模型仅限于成对依赖性。另一方面,[6]和[7]已经表明,通过平滑边际极值分布的参数,可以在一定程度上捕捉空间依赖性。然而,在考虑参数依赖性后,不同位置的极端事件被假定为条件独立。最近,Sang等人[8]通过高斯Copula缓解了条件独立性假设,允许边际遵循GEV分布,同时通过高斯潜在层中的指数协方差函数捕捉空间依赖性。使用高斯潜在层的明显优势在于,一旦指定了均值和协方差结构,就可以直接计算边际和条件分布。然而,Sang等人[8]假设GEV分布的形状和尺度参数在空间中不变,这对于在大范围空间域内出现显著波动的现象(例如,与飓风对应的全球极端海洋状态)来说,可能不太适用。[8]模型的另一个困难是,标准高斯Copula由密集协方差矩阵参数化。因此,在这种模型中的推断具有计算复杂性,并且对于高维数据(例如,具有数千个站点的大网格)可能难以处理[9]。
我们引入了一种与[8]方法类似的新型模型。其主要思想是在极端空间模型中引入马尔可夫随机场(MRF),具体来说,是薄膜模型。更准确地说,我们使用稀疏精度矩阵(逆协方差矩阵)与薄膜模型结构来捕捉空间依赖性,大大减少了计算复杂性。此外,我们允许边际GEV参数在空间中变化:我们通过薄膜模型[7]将其平滑。GEV参数通过高斯推断进行估计。薄膜模型的平滑参数,它们是整体模型中的超参数,通过期望最大化从数据中推断得出。结果估计的形状和尺度参数更加准确,并且可能在空间上有系统地变化,而不是恒定不变。我们将所提出的方法称为Copula MRF-GEV模型。详细文章见第4部分。
📚2 运行结果
部分代码:
%% read data
load artiData(16x16)_L; %column-major index
Xtrain=XDat(:,1:256);
[n,p]=size(Xtrain);
s1=16;
s2=16;
Jp=thin_membrane(s1,s2); %s1 num of rows, s2 num of cols
%% bootstrapping
N=3000; %no. of bootstrap subsets
Id=bootstrap(Xtrain,N);
%% GEV fitting and smoothing
[L0,G0,S0,L_Var,G_Var,S_Var] = GEVPrm_bootstrap (Xtrain,N,Id);
[Lh,alpha_u]=EM_Smth(L0,L_Var,Jp);
[Gh,alpha_g]=EM_Smth(G0,G_Var,Jp);
[Sh,alpha_s]=EM_Smth(S0,S_Var,Jp);
%% couple waveheights for all the sites using copula Gaussian thin-membrane model
GXtrain = gcopula(Xtrain,Lh,Gh,Sh);
Semp=cov(GXtrain,1);
K=gaussIPF(Jp,Semp,1); %1e-4,50
%% interpolation
Xtrue=XDat(:,257:end);
Ltttest=Ltt(257:end);
Lngtest=Lng(257:end);
%% interpolating parameters using IDW: only consider four nearest neighbours
Gtest=Prm_interpolation(Ltttest,Lngtest,Gh,alpha_g,s1); %only num of rows needed due to the col-major index
Stest=Prm_interpolation(Ltttest,Lngtest,Sh,alpha_s,s1);
Ltest=Prm_interpolation(Ltttest,Lngtest,Lh,alpha_u,s1);
%% interpolating waveheights in the latent Gaussian layer using MIDW
GXtest=Val_interpolation(Ltttest,Lngtest,GXtrain,K,s1);
%% convert to GEV
Xtest=gevinv(normcdf(GXtest),repmat(Gtest,n,1),repmat(Stest,n,1),repmat(Ltest,n,1));
🎉3 参考文献
文章中一些内容引自网络,会注明出处或引用为参考文献,难免有未尽之处,如有不妥,请随时联系删除。