基于混合核高斯过程回归及输入选择优化算法的月径流预测
Seasonal streamflow forecasts using mixture-kernel GPR and advanced methods of input variable selection
成果信息
Zhu S, Luo X, Xu Z, et al. Seasonal streamflow forecasts using mixture-kernel GPR and advanced methods of input variable selection[J]. Hydrology Research, 2019, 50(1): 200-214.
团队成员
朱双(第一作者),中国地质大学(武汉)地理与信息工程学院,讲师,硕士生导师。研究方向:陆面水文过程模拟、预测与响应。
罗显刚(通讯作者),中国地质大学(武汉)地理与信息工程学院,副教授,硕士生导师。研究方向:网络与移动地理信息系统、地质环境大数据与地质灾害预警。
成果介绍
高斯过程回归(GPR)是一种基于贝叶斯理论和统计学习理论的机器学习方法。它为概率回归和不确定性评估提供了灵活的框架。GPR建模的关键工作是确定核函数的结构。由于河道流量可看作由趋势,周期和随机项组成,我们构造了一个由平方指数核,周期核和有理二次项组成的混合核,以反映流量时间序列的不同属性。同时,通过随机森林自上而下搜索相关特征集,系统分析可能影响径流量可预测性的因子。低流量偏差,高流量偏差和整体误差水平等评估指标表明,本文提出的基于混合核和特征选择优化算法的模型具有良好的预测能力。
采用相关特征选择算法迭代地比较了前期径流、尼诺3.4、西半球暖池、海洋尼诺指数等108个预测变量的重要性,其中83个预测因子具有较高重要性,而金沙江径流量和东太平洋海温指数具有比其他预测因子更强的相关性。
图1 基于随机森林迭代搜索的特征因子重要度
GPR预测结果表明其预测性能较好,且90%的置信区间能覆盖多数时期径流值。同时,观察到置信区间相对点预测值不对称,原因是模型建立过程中使用Box-Cox转换使径流符合高斯分布,其为非线性变换过程,在逆转换95%分位数值,5%分位数值以及均值后,会发生不对称情况。
图2 GPR径流预测结果及90%置信区间
采用预测一致性,高流量误差、低流量误差等五个指标评估GPR和GRNN预测模型,结果表明GPR的预测统计值优于GRNN的统计值。
表1 GPR与GRNN预测统计
微信号:cugxgxy
投稿邮箱:3444374679@qq.com
锐藏信工,思于毫芒