时间序列是按时间顺序组织的数字序列,是数据分析中重要的处理对象之一。时间序列的主要特点是数据获取方式一般具有客观性,能反映某种现象的变化趋势或统计指标,进而预测未来走向,这在本质上也是一个回归预测的问题。长短期记忆网络(LSTM)是一种常用的循环神经网络,适合处理有更长时间跨度的内部记忆,被广泛应用于时间序列分析,能够保持数据的内在持续性,反映数据的细粒度走势,具有良好的预测效果。
一、数据集介绍
厄尔尼诺-南方涛动(ENSO)是影响全球极端气候的重要因子,因此预估ENSO海温在全球变暖下的变化也是预估未来全球变暖下全球极端气候变化的重要因素之一。遗憾的是,最近20年来多次的全球耦合模式比较计划(CMIP)尽管对气候平均态和ENSO本身的模拟都取得了长足的进步,但是对未来增暖情形下ENSO海温异常强度的变化都存在显著的模式间差异。最近CMIP5预估的ENSO海温增强或减弱的模式个数基本相当,模式间的标准差远大于多模式集合平均的结果。因此揭示各模式预估ENSO海温振幅变化存在显著差异的核心物理过程是未来进一步改进模式、提高模式预估可信度的必要途径。
MATLAB自带了enso的数据集,只需要load就可加载:
load enso
加载后,工作区增加了month和pressure两个168*1的数据。我们可以利用plot函数绘制enso的时间序列数据,绘制代码如下:
load enso
figure;plot(month,pressure,'k:',month,pressure,'r*');
运行图像:
二、通过样条算法进行曲线拟合
通过MATLAB提供的fit函数可以方便进行曲线拟合及预测分析,主要代码如下:
close all;clear all;clc;
rand('seed',10) %设置随机数种子
%加载数据
load enso
data_x=month;data_y=pressure;
%样条拟合
[res1,res2,res3]=fit(data_x,data_y,'smoothingspline');
%绘图
figure;
subplot(2,1,1)
plot(data_x,data_y,'r*');
hold on;
plot(res1,data_x,data_y);
title(sprintf('样条分析-RMSE=%.2f',res2.rmse));
subplot(2,1,2)
stem(data_x,res3.residuals)
xlabel('Time');ylabel('Error'