数据集为中国陆地0.25°分辨率年降水频率模型的最优分布和及其参数集(包含台湾),共15355个数据网格。数据集共有广义极值分布(GEV),三参数伽马分布(P3),广义帕累托分布(GP),对数正态分布(LN),对数逻辑分布(LL),韦伯分布(Weibull)6种备选分布。
数据集包含了中国陆地1948-2016年的年降水量的最优频率模型分布和及其参数(包含台湾),空间分辨率为0.25°,一共15355个降水网格。本数据集的研究基础是税军峰发布的“1948-2016年中国0.25°分辨率年降水量数据集”。本数据集采用遗传算法(GA)和差分进化算法(DE)分别对6种备选分布求解4次后,确定最优分布。主要结果:(1)实际年降水和频率分布模型拟合良好,在所有降水网格中,最大的均方根误差为90.37(mm)。(2)在所有的降水网格中,49.7%的降水网格属于GEV分布,29.7%的降水网格属于P3分布,13.3%的降水网格属于LL分布,7.3%的降水网格属于Weibull分布,极少量网格(0.1%)属于GP分布和LN分布。
#2数据解释
首先,选择备选分布,选择在我国年降水频率中常见和适用的广义极值分布(GEV),三参数伽马分布(P3),广义帕累托分布(GP),对数正态分布(LN),对数逻辑分布(LL),韦伯分布(Weibull)六种模型作为备选分布。其中GEV,P3,GP为三参数分布,LN,LL,Weibull是双参数分布。
其次,采用6种频率分布模型对15355个降水网格进行按均方根误差最小为目标逐个拟合,并记录每个频率分布模型最小均方根误差和最优参数值。第一步,采用GA算法求解一次,初步得到6种分布参数的范围;以初步范围作为参数值的上下限,分别采用GA和DE求解两次,取4次中最优值得到6种频率分布模型在降水网格中的最小均方根误差值和最优参数值。
最后,选择六种频率分布模型中均方根误差最小的分布作为该网格的最优分布,并记录该分布的参数值。
数据集以csv格式呈现,在csv文件中:OBJECTID是数据网格的编号,Lat代表像元右上角的纬度,lon代表像元右上角的经度,index分别代表最优分布的参数值,a,b,c代表最优参数,min_rmse代表最优分布模型和实际降水量的均方根误差值。最优分布的评价标准为降水量经验频率和理论频率的均方根误差(RMSE)。
六种参数含义为见以下表格: