LSTM实战:空气质量预测

最新推荐文章于 2025-04-02 14:27:21 发布

缦旋律

最新推荐文章于 2025-04-02 14:27:21 发布

阅读量1.3w

点赞数 17

分类专栏： pytorch 深度学习

小陈一行一行地敲出来的啦~

本文链接：https://blog.csdn.net/weixin_41391619/article/details/109128375

版权

本文介绍了使用LSTM进行空气质量预测的实战过程，包括原始数据预览，数据预处理（如删除有缺失值的列并归一化），设置超参数，搭建LSTM网络，创建自定义dataset以及训练模型并选择最佳模型。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

数据集请戳：
缦旋律的资源合集

1.原始数据预览

原始数据是北京的空气质量数据，如下图所示：
在这里插入图片描述

其中第二列有缺失值，但是该列是由根据其他列（具体是哪一列我忘了）的数值大小来赋值的，因此第二列可以直接删掉。

import pandas as pd
import torch
import numpy as np
from torch import optim
from torch import nn
from torch.utils.data import DataLoader,Dataset
import pickle

2.数据预处理

这个数据集比较干净，只做了归一化处理。

#原始数据预处理
ori = pd.read_excel('./beijing.xlsx',header=None)

data = ori.drop(columns=2)

col_names = ['date','aqi','pm2','pm10','so2','co','no2','o3']

data.columns = ['date','aqi','pm2','pm10','so2','co','no2','o3']

pro = data.iloc[:,1:]

for name in col_names[1:]:
    pro[name] = (pro[name]-pro[name].min())/(pro[name].max()-pro[name].min())#归一化处理

pro['date'] = data['date']

pro.to_excel('pro_data.xlsx',index=False)

pro = pd.read_excel('./pro_data.xlsx')

经过预处理后的数据长这样：
在这里插入图片描述

3.设置超参数

#设置超参数
x_timesteps = 5 #用多少期去预测（在RNN模型中x_timesteps就是cell的个数）
y_timesteps = 1 #老师说一般都只预测一期，所以y_timestpes应该就是固定值1，但是后面Env我懒得改了，所以这里还是保留了y_timesteps这个超参数
stride = 2 #每次移动多少期来采样
hidden_size = 20 
hidden_layers = 1
y_features = 7 #最终你想要预测多少个特征，比如我用前5期的7个特征预测滞后期的7个特征，那么y_features就是7；如果只想预测其中某个特征，那么y_features就是1
if y_features<7:
    the_col_wanted =  [int(x) for x in input('输入您想要的列，若超过1列，请用,隔开（英文逗号）。您选择的列是：').split(',')] #你想要预测的特征，这个长度必须与y_features一致
    if len(the_col_wanted) == y_features:
        print('您最终选择的列是：',the_col_wanted)
    else:
        print('您的选择有误,请重新进行选择')
else

最低0.47元/天解锁文章