讲真,研究这个RNN参数我花了好几天,博客中基于pytorch的不多,即使有也没结合实例,有些博客互相也不一致,理解起来很费劲。。这中间又因为准备考试,隔了两三周,现在接着来看,战线属实够长。。迷迷糊糊看懂了,特意梳理一下,让思路更清晰,也方便以后查阅。如果讲述有误,欢迎指正~
- 先上完整代码,参数解释在注释中,个别参数完整输出贴在后面,方便理解。
RNN输入数据
输入维度是11,输出维度是1
# -*- coding: utf-8 -*-
"""
Created on Tue Jul 7 16:15:10 2020
@author: admin
"""
# 先把数据改成X-y形式,输入用time-step决定
from sklearn import preprocessing
import pandas as pd
import numpy as np
import sys
import torch.optim as optim
import torch
import torch.nn as nn
import matplotlib.pyplot as plt
import numpy as np
np.set_printoptions(threshold=np.inf)
pd.set_option('display.max_rows', None)
pd.set_option('display.max_columns', None)
#n_in,n_out决定了X-y数据形式,series_to_supervised函数的作用是将n行数据拼接成一条训练数据,
#至于哪部分做X,哪部分做y则由后面数组切片决定(train_X, train_y = train[:, :-1], train[:, -1])
#如果n_in为1代表一条输入作为x,如果n_in为2代表两条输入作为x,以此类推
#如果n_out为1代表往后预测一个时刻的输出,如果n_out为2代表往后预测两个时刻的输出,以此类推
#虽然这部分n_in,n_out的设计并不会对后面的训练有实质的影响。起实质影响的是数组切片(train_X, train_y = train[:, :-1], train[:, -1])
#但最好保证这块输入输出设计与后面的切片一致,方便理解
def series_to_supervised(data, n_in=1, n_out=1, dropnan=True):
n_vars = 1 if type(data) is list else data.shape[1]
df = pd.DataFrame(data)
cols, names = list(), list()
# input sequence (t-n, ... t-1)
for i in range(n_in, 0, -1):
cols.append(df.shift(i))
names += [('var%d(t-%d)' % (j+1, i)) for j in range(n_vars)]
# forecast sequence (t, t+1, ... t+n)
for i in range(0, n_out):
cols.append(df.shift(-i))
if i == 0:
names += [('var%d(t)' % (j+1)) for j in range(n_vars)]
else:
names += [('var%d(t+%d)' % (j+1, i)) for j in range(n_vars)]
# put it all together
agg = pd.concat