【RNN入门到实战】LSTM从入门到实战——实现空气质量预测

最新推荐文章于 2024-06-11 10:42:22 发布

2301_79099373

最新推荐文章于 2024-06-11 10:42:22 发布

阅读量638

点赞数 15

分类专栏： 2024年程序员学习文章标签： rnn lstm 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_79099373/article/details/137663640

版权

本文介绍了如何使用LSTM（长短期记忆网络）进行空气质量预测，涉及数据预处理、特征工程、模型构建以及使用动图演示LSTM的工作原理。通过处理气象数据并构建预测模型，评估了模型性能并展示了关键步骤和技术细节。

摘要由CSDN通过智能技术生成

动图演示

在这里插入图片描述

输出层门

作用对象：隐层 h t h_t ht

作用：确定输出什么值。

操作步骤：

步骤一：通过sigmoid 层来确定细胞状态的哪个部分将输出。

步骤二：把细胞状态通过 tanh 进行处理，并将它和 sigmoid 门的输出相乘，最终我们仅仅会输出我们确定输出的那部分。

其示意图如下所示：

在这里插入图片描述

动图演示

在这里插入图片描述

实战——使用LSTM实现空气质量预测

=============================================================================

数据来源自位于北京的美国大使馆在2010年至2014年共5年间每小时采集的天气及空气污染指数。

数据集包括日期、PM2.5浓度、露点、温度、风向、风速、累积小时雪量和累积小时雨量。原始数据中完整的特征如下：

1.No 行数

2.year 年

3.month 月

4.day 日

5.hour 小时

6.pm2.5 PM2.5浓度

7.DEWP 露点

8.TEMP 温度

9.PRES 大气压

10.cbwd 风向

11.lws 风速

12.ls 累积雪量

13.lr 累积雨量

我们可以利用此数据集搭建预测模型，利用前一个或几个小时的天气条件和污染数据预测下一个（当前）时刻的污染程度。

数据处理

首先，我们必须清洗数据。以下是原始数据集的前几行。

No year month day hour pm2.5 DEWP TEMP PRES cbwd Iws Is Ir

0 1 2010 1 1 0 NaN -21 -11.0 1021.0 NW 1.79 0 0

1 2 2010 1 1 1 NaN -21 -12.0 1020.0 NW 4.92 0 0

2 3 2010 1 1 2 NaN -21 -11.0 1019.0 NW 6.71 0 0

3 4 2010 1 1 3 NaN -21 -14.0 1019.0 NW 9.84 0 0

4 5 2010 1 1 4 NaN -20 -12.0 1018.0 NW 12.97 0 0

5 6 2010 1 1 5 NaN -19 -10.0 1017.0 NW 16.10 0 0

6 7 2010 1 1 6 NaN -19 -9.0 1017.0 NW 19.23 0 0

7 8 2010 1 1 7 NaN -19 -9.0 1017.0 NW 21.02 0 0

8 9 2010 1 1 8 NaN -19 -9.0 1017.0 NW 24.15 0 0

9 10 2010 1 1 9 NaN -20 -8.0 1017.0 NW 27.28 0 0

数据理清的步骤：

1、将year, month, day, hour四列整合为一个日期时间。

2、删除No列，这个列对于数据预测没有作用，如果有作用说明见鬼了。

3、将数据集中所有的NaN设置为0，NaN没有办法用来计算。

4、删除前24行，前24行的pm2.5没有记录，留着没有用。

完整的代码如下：

from pandas import read_csv

from datetime import datetime

load data

def parse(x):

return datetime.strptime(x, ‘%Y %m %d %H’)

读取数据，将year, month, day, hour四列合并成一列。

dataset = read_csv(‘raw.csv’, parse_dates = [[‘year’, ‘month’, ‘day’, ‘hour’]], index_col=0, date_parser=parse)

删除No列

dataset.drop(‘No’, axis=1, inplace=True)

修改列名

dataset.columns = [‘pollution’, ‘dew’, ‘temp’, ‘press’, ‘wnd_dir’, ‘wnd_spd’, ‘snow’, ‘rain’]

dataset.index.name = ‘date’

print(dataset)

将所有的NaN设置为0

dataset[‘pollution’].fillna(0, inplace=True)

删除前24行

dataset = dataset[24:]

浏览前5行数据

print(dataset.head(5))

save to file

dataset.to_csv(‘pollution.csv’)

加载了“pollut

最低0.47元/天解锁文章

关注

15
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
【RNN入门到实战】LSTM从入门到实战——实现空气质量预测

Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照下面的知识点去找对应的学习资源，保证自己学得较为全面。
复制链接

扫一扫

专栏目录

普通网友 CSDN认证博客专家 CSDN认证企业博客

码龄1年

281: 原创

-: 周排名

-: 总排名

19万+: 访问

: 等级

6977: 积分

2869: 粉丝

3812: 获赞

11: 评论

3972: 收藏

私信

关注

热门文章

分类专栏

2024年程序员学习 124篇
程序员 143篇

最新评论

Python调用高德地图API实现经纬度换算、地图可视化_python 高德地图经纬度
行十万里人生: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，文章思路清晰，图文并茂，详略得当，三连支持，期待博主持续输出好文!
基于python保洁家政服务预约系统设计与实现（Django框架）
普通网友: 博主的文章让我对这个主题有了全新的认识，细节描写非常到位，让我感受到了博主的深厚功底。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
基于python保洁家政服务预约系统设计与实现（Django框架）
普通网友: 学到了，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
数据可视化入门篇----操作CSV格式数据并进行简单的可视化
普通网友: 干货满满，实用性强，博主的写作风格简洁明了，让人一目了然。文章涵盖了很多实用的知识点。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
让你不得不学Python 的十大重要理由_让你不得不学python 的十大重要理由_dm_it的博客-csdn博客(1)
普通网友: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，期待博主持续带来更多好文【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。