来源:债券圈
作者:董成
作者为济宁市金融学会研究智库成员
未经授权,不得转载
1 GMDH神经网络概述GMDH全称Group Method of Data Handling(数据处理的群方法),是一种复杂非线性系统的启发式自组织建模方法——数据处理组合方法,是一种以多项式为基础通过不断筛选组合来辨识非线性系统的模型,它对于高阶非线性系统的辨识有效。具有GMDH组织结构的神经网络称为GMDH神经网络,也称为多项式网络,是前馈神经网络中一种用于预测的实用神经网络,其特点是网络结构不固定,而是在训练过程中不断地改变。相对于传统多层神经网络算法, GMDH算法具有如下特点:
⑴建模过程自组织控制, 不需任何初始假设;
⑵最优复杂性及高精度预测;
⑶能够自组织多层神经网络的每层最佳结构,即能够自动地保留有用的变量和删除多余的变量;
⑷能够自动选择最佳的网络层数和每层的神经元数目。
正是由于GMDH算法的这些优点,决定了其是一种实用性比较强的预测方法。
2 GMDH神经网络的主要思想GMDH神经网络的主要思想是由系统各输入单元交叉组合产生一系列的活动神经元, 其中每一神经元都具有选择最优传递函数的功能, 再从已产生的一代神经元中选择若干与目标变量最为接近的神经元, 被选出神经元强强结合再次产生新的神经元, 重复这样一个优势遗传、竞争生存和进化的过程, 直至新产生的一代神经元都不比上一代更加优秀, 于是最优模型被选出。类似于其它神经网络, GMDH 算法具有如下两个基本思想: ① 以分析黑箱的方法处理系统输入输出关系;② 用网络间元素的互联关系描述网络的功能。 GMDH 神经网络的构建过程主要是一个不断产生活动神经元, 由外部准则对神经元进行筛选, 筛选得到的神经元强强结合再产生下一层神经元,直至具有最佳复杂性的模型被选出的这样一个过程。
上图中xi 为初始输入变量, G 称为部分多项式, 它是两个输入变量的完全二次多项式,Yi (k )是由部分模型计算得到的输出, 部分模型是通过拟合实测数据辨识得到的, X i(k ) 是中间变量, 是从Yi(k ) 中按各层的检验准则筛选出来的, 作为下一层的输入。
GMDH 网络的结构在训练过程中是不断的变化的,如下图所示的训练后的一个典型的网络结构。
该网络有 4 个输入和一个输出。 GMDH 网络的输入层加工输入信号前向传递到中间层,中间层的每个神经元和前一层的两个神经元对应,因此,输出层的前一层(中间层)肯定只有两个神经元。
3 基于GMDH神经网络债券收益率预测步骤与过程(一)数据选取与载入
选取10年国开债2017年8月9日至2019年5月24日开盘收益率进行分析,组成1*441的矩阵,加载数据并进行调用。
(二)构造训练样本数据
在本次训练中,选用10年国开债2017年8月9日至2019年5月24日开盘收益率前60%数据作为训练样本,构造最多神经元为20个,最多网络层数为10,训练比率为0.5的GMDH神经网络。(MaxNeurons = 20、MaxLayers = 10、Train Ratio= 0.5)
从上面三个图可以看出GMDH神经网络训练样本数据预测收益率与实际收益率高度吻合,拟合度达到0.99264,均方误差0.001252,均方根误差0.035383,说明60%数据样本特征明显,GMDH神经网络样本数据预测较为准确。
(三)根据训练样本数据特征预测后40%债券开盘收益率,如下图
从上面两个图可以看出,GMDH网络预测后40%债券开盘收益率拟合度为0.98796,说明预测相当准确。
4 基于GMDH神经网络债券收益率预测实证分析根据上述预测将GMDH神经网络预测的后40%债券收益率输出与实际收益率进行对比,如下表:
序号 |
预测开盘收益率 |
实际开盘收益率 |
误差(BP) |
序号 |
预测开盘收益率 |
实际开盘收益率 |
误差(BP) |
1 |
4.1855 |
4.215 |
-0.03 |
88 |
3.5395 |
3.585 |
-0.05 |
2 |
4.2109 |
4.2075 |
0.00 |
89 |
3.5695 |
3.59 |
-0.02 |
3 |
4.2055 |
4.2075 |
0.00 |
90 |
3.5756 |
3.615 |
-0.04 |
4 |
4.2099 |
4.22 |
-0.01 |
91 |
3.6075 |
3.6 |
0.01 |