基于滑动窗口的时间序列数据相关性分析计算

在以往的项目中,我们想要计算时间序列的相关性的话,大都是把整体的数据中不同维度的数据当做是一个整体序列来进行两两序列之间的相关性分析计算,也比较简洁实用一些,这里今天遇上一个新的需求就是,我们需要把滑窗这一工具加入进来,原本滑窗是为了创建监督数据集为时间序列预测模型服务的,但是这里可以将其用作于相关性计算,通过切分出来不同的片段数据,可以计算出来多组相关性数据,也就是说在以往的实践中,序列A和序列B的相关性结果是一个数值,这里序列A和序列B的相关性结果也是一个序列,这个序列的长度取决于切分得到的窗口的数量。

首先看下自己创建的数据集,样例如下:

 接下来需要对原始数据集进行解析转化处理,核心实现如下所示:

def parseData(data="data1.xlsx", save_path="data.json"):
    """
    解析数据集
    """
    data = pd.read_excel(data)
    data_list = data.values.tolist()
    print("data_list_length: ", len(data_list))
    title_list = data_list[0]
    for one_list in data_list[:5]:
        print(one_list)
    res_list=[]
    for one_list in data_list:
        one_vec=[float(one) for one in one_list[1:]]
        res_list.append(one_vec)
    with open(save_path,"w") as f:
        f.write(json.dumps(res_list))

结果数据如下所示:

 这里我们首先对整体序列数据进行相关性分析计算,核心实现如下所示:

def main(data="data.json"):
    """
    主入口
    """
    with open(data) as f:
        data_list=json.load(f)
    print("data_list_length: ", len(data_list))
    matrix = dataTransform(data_list)
    title = "因子相关性分析热力图"
    label = ["X"+str(i) for i in range(1,12)]
    print("label: ", label)
    relationAnalysis(matrix, label, title, savepath="heatmap.png")

很多组件函数在我以往的文章中都有,这里就不再赘述了,可视化得到的热力图如下所示:

 之后,我们开始基于滑窗来对其进行数据的片段切分处理,核心实现如下所示:

def windowsRelation(data="data.json",step=200):
    """
    计算滑窗相似度
    """
    with open(data) as f:
        data_list=json.load(f)
    print("data_list_length: ", len(data_list))
    windows=sliceWindow(data_list,step)
    for i in range(len(windows)):
        one_window=windows[i]
        one_matrix = dataTransform(one_window)
        title = "因子相关性分析热力图"
        label = ["X"+str(i) for i in range(1,12)]
        print("label: ", label)
        relationAnalysis(one_matrix, label, title, savepath="window_heatmap_"+str(i)+".png")

在我的数据集种,总样本数据集1000+左右,所以能够切分得到5个时间片段的窗口数据,这里为了能够直观地呈现结果数据,对其进行了热力图的可视化展示,如下所示:

窗口1:

 窗口2:

 窗口3:

 窗口4:

 窗口5:

 还是能够看到跟整体序列计算结果上面的差异的。

  • 4
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Together_CZ

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值