【深度学习】CNN模型处理简单时间序列

本文使用CNN模型,Conv1d卷积进行时间序列的分析处理。将数据导入模型后,可以运行。但模型预测精度不高,且输出十分不稳定。此模型仅用于熟悉CNN模型的基本结构,如有错误,还望海涵。

一、数据介绍

数据长度为252,在导入模型时,将80%的数据用于模型训练,20%的数据用于模型验证。
在这里插入图片描述

二、数据预处理

先对数据进行归一化处理,以加快模型运行速度。数据预测原理为,将n个数据分为一组,用前n-1个数据来预测第n个数据,通过预测值与实际值计算损失值。再向后推进,每次推进长度为1。
例如,如果数据序列为[1,2,3,4,5,6],n=4。则第一次将[1,2,3]输入模型,将模型输出结果和4导入损失计算函数进行损失计算,下一次将[2,3,4]导入,以此类推。

三、模型代码

模型结构
在这里插入图片描述

模型定义代码

import torch
import torch.nn as nn
from tensorboardX import SummaryWriter


class CNNnetwork(nn.Module):
    def __init__(self):
        super().__init__()
        self.conv1d = nn.Conv1d(1, 64, kernel_size=2)
        self.relu = nn.ReLU(inplace=True)
        self.Linear1 = nn.Linear(64 * 8, 50)
        self.Linear2 = nn.Linear(50, 1)

    def forward(self, x):
        x = self.conv1d(x)
        x = self.relu(x)
        x = x.view(-1)
        x = self.Linear1(x)
        x = self.relu(x)
        x = self.Linear2(x)
        return x


if __name__ == '__main__':
    mod = CNNnetwork()
    input = torch.ones(1, 1, 9)
    out = mod(input)
    print(out.shape)

    writer = SummaryWriter('logdir')
    writer.add_graph(mod, input)
    writer.close()

模型训练与验证

import pandas as pd
import numpy as np
import torch
from matplotlib import pyplot as plt
from sklearn.preprocessing import MinMaxScaler
from CNN_model import *

Datasets = pd.read_excel(io='dataset.xlsx', sheet_name='Sheet1', usecols='D')
data = Datasets['data'].values.astype(float)
train_set = data[:-int(len(data) * 0.2)]
test_set = data[-int(len(data) * 0.2):]
# print(len(train_set))   # 202
# print(len(test_set))    # 50

scaler = MinMaxScaler(feature_range=(-1, 1))
train_norm = scaler.fit_transform(train_set.reshape(-1, 1))
train_norm = torch.FloatTensor(train_norm).view(-1)
train_data = []
seq_size = 9
for i in range(len(train_norm) - seq_size):
    window = train_norm[i:i + seq_size]
    label = train_norm[i + seq_size]
    train_data.append((window, label))

mod = CNNnetwork()

loss_fn = nn.MSELoss()

learning_rate = 1e-2
optimizer = torch.optim.SGD(mod.parameters(), lr=learning_rate)
# optimizer = torch.optim.Adam(mod.parameters(), lr=learning_rate)
total_train_step = 0
epoch = 500
loss_list = []
mod.train()
for i in range(epoch):
    for seq, y_true in train_data:
        optimizer.zero_grad()
        out = mod(seq.reshape(1, 1, -1))
        loss = loss_fn(out, y_true)
        loss.backward()
        optimizer.step()
        total_train_step = total_train_step + 1
        if total_train_step % 1000 == 0:
            print('训练次数:{},loss:{}'.format(total_train_step, loss.item()))
            loss_list.append(loss.item())

preds = train_norm[-seq_size:].tolist()
mod.eval()
for i in range(52):
    seq = torch.FloatTensor(preds[-seq_size:])
    with torch.no_grad():
        preds.append(mod(seq.reshape(1, 1, -1)).item())
print(preds)
true_value = scaler.inverse_transform(np.array(preds[seq_size:]).reshape(-1, 1))
print(true_value.tolist())
print(test_set)
plt.figure(1)
plt.plot(test_set, label='true value')
plt.plot(true_value, label='predict value')
plt.legend(loc="upper left")
plt.figure(2)
plt.plot(loss_list, label='loss')
plt.show()
torch.save(mod, 'mod_1.pth')

代码中,每10个数据为一组,用reshape函数使数据符合Conv1d要求。

四、模型输出结果

再不断调整损失函数、优化器、学习率、训练次数后,模型拟合效果依然不稳定。最大的原因可能为数据之间无直接关联性,无法通过数字间的关联找出规律。
下面为50个验证数据的拟合效果,蓝色线条为真实值,橙色为模型拟合值。
在这里插入图片描述
下图为模型训练过程中损失变化,每一千次训练记录一次损失。
在这里插入图片描述

五、参考文献

本文数据处理及模型构建思路参考了以下文章:CNN实现时间序列预测(PyTorch版)

  • 2
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 利用Keras构建CNN模型处理时间序列数据主要通过将时间序列数据转化为二维图像矩阵的形式,然后通过卷积神经网络(CNN)对这些图像进行训练和预测。 首先,需要将时间序列数据转化为二维图像矩阵。一种常见的方法是使用滑动窗口技术,将时间序列数据分割成不同的窗口,然后将每个窗口中的数据作为图像的行或列,将时间步作为图像的列或行。例如,对于一个长度为n的时间序列,如果选择窗口大小为m,则得到m个长度为n-m+1的窗口,将每个窗口中的数据作为图像的行,时间步作为图像的列。 然后,通过构建CNN模型处理这些图像。在Keras中可以使用Sequential模型来构建CNN模型模型的各个层可以按照卷积层、池化层和全连接层的顺序依次添加。对于卷积层,可以选择不同的卷积核大小和数量,以提取不同尺寸和数量的特征。对于池化层,可以选择不同的池化窗口大小和步幅,以进行特征的下采样。最后,通过全连接层将提取到的特征映射到具体的类别或数值。 在训练过程中,可以使用交叉熵损失函数和梯度下降法来进行优化。通过反向传播算法,可以更新模型中的参数,以最小化损失函数。同时,可以使用一些常见的技巧,如批量标准化和dropout,来提升模型的性能并减少过拟合的风险。 最后,在模型训练完成后,可以使用该模型对新的时间序列数据进行预测。将新的时间序列数据转换为图像矩阵,然后通过已训练好的模型进行预测,得到具体的类别标签或数值预测结果。 总而言之,利用Keras构建CNN模型处理时间序列数据的关键是将时间序列数据转换为二维图像矩阵,并通过构建合适的CNN模型处理这些图像,进行训练和预测。这种方法可以应用于各种时间序列相关的任务,如股票预测、语音识别和视频分析等。 ### 回答2: 利用Keras构建CNN模型处理时间序列是一种常用的方法。在处理时间序列数据时,常常需要考虑数据的时间维度和空间维度。CNN能够有效地捕捉时间序列数据中的空间关系和模式,使模型能够更好地理解数据。 首先,我们需要准备时间序列数据。时间序列数据通常是一个二维数组,其中一维表示时间步长,另一维表示特征数。然后,我们可以使用Keras提供的Conv1D层来构建卷积神经网络模型。该层会将时间序列数据作为输入,并进行一系列卷积操作来提取特征。 在构建CNN模型时,我们可以添加多个Conv1D层,每个层通过改变过滤器的数量、过滤器的大小和步幅的设置来提取不同层次的特征。此外,可以添加池化层来减小特征的维度。最后,我们可以添加全连接层和输出层来进行分类或回归任务。 在训练CNN模型之前,需要定义模型的优化器、损失函数和评估指标,并编译模型。随后,可以使用训练数据对模型进行训练,并使用验证数据进行验证。 在建立CNN模型时,需要根据具体问题来选择模型的结构与参数。例如,当处理长期依赖的时间序列数据时,可以添加LSTM或GRU层来引入记忆性。 总而言之,利用Keras构建CNN模型处理时间序列数据是一种有效的方法。但需要根据具体问题来选择合适的模型结构和参数设置,并经过充分的训练和验证,以获得较好的性能。 ### 回答3: Keras是一个用户友好的深度学习库,可以方便地构建卷积神经网络(CNN模型处理时间序列数据。 首先,我们需要导入Keras库的相关模块,并定义我们的模型。对于时间序列数据,我们通常会使用一维卷积层来提取特征。模型的结构可以根据具体的问题而定,但通常会包括一些卷积层、池化层和全连接层。 接下来,我们需要准备我们的数据。时间序列数据的输入应该是一个三维数组,具体来说是一个形状为(样本数量,时间步长,特征数量)的数组。我们可以使用Keras提供的函数将数据转换成这个形状。 然后,我们可以编译我们的模型,指定优化器、损失函数和评价指标。在处理时间序列数据时,我们通常会使用均方误差(MSE)作为损失函数,Adam优化器进行优化。 最后,我们可以使用模型对数据进行训练和预测。通过调用fit函数,将输入数据和输出数据作为参数传递给模型,指定训练的轮数和批处理大小,模型会自动进行训练。完成训练后,我们可以使用模型对新数据进行预测。 总之,通过Keras构建CNN模型处理时间序列数据是一种简单且高效的方法。通过定义模型结构、准备数据、编译模型以及训练和预测,我们可以利用Keras轻松地处理时间序列数据。这种方法在诸如信号处理、股票预测、自然语言处理等领域都有广泛的应用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值