(二)时间序列相似性度量的一个实例
我们取2008年8月25日——2008年9月5日共10个交易日的所有中小板块股票的收盘价格构成数据集如下图。
在这10个交易日中,每天都有交易的中小板股票共有229支,再加上中小板指数(sz399005),共有230个时间序列数据,如果我们考察每两个时间序列的相似性,将有Combine(230,2)=26335个时间序列对。我们使用如下SAS程序可以计算出这26335个时间序列对的相似度指标。
%let N=230;
%let M=10;
%let in=stock.finaldata;
%let out=stock.similar;
data temp(drop=stockid date close n k);
do id=1 to (&N-1)*&M by &M;
set &in point=id;
var1=stockid;
do j=(id+&M) to &N*&M by &M ;
set &in point=j;
var2=stockid;
do k=0 to (&M-1);
d1=id+k;
set &in point=d1;
data1=close;
d