python问题中国五城市pm2.5_数据之路- 中国五城市PM2.5数据解读

本文通过分析Kaggle上的中国五大城市PM2.5数据,展示了从2010年至2015年间各城市PM2.5指数的变化趋势。北京的PM2.5指数最高,而广州最低。2013年后,除沈阳外,其他城市PM2.5指数呈下降趋势。研究发现,夏季空气质量普遍优于冬季,且北京的空气质量受露点、湿度和风速影响显著。12月是全年空气质量最差的月份,北京有8天达到严重污染。
摘要由CSDN通过智能技术生成

PM2.5大家一定都不会陌生,特别是在北京生活的小伙伴们。PM2.5是指大气颗粒物(PM),其直径小于或等于2.5微米。在环境科学中,特指悬浮在空气中的固体颗粒或液滴,是空气污染的主要来源之一。

本文旨在探寻中国五大城市的PM2.5指数的数据情况@中国五城市PM2.5数据解读

PM2.5大家一定都不会陌生,特别是在北京生活的小伙伴们。PM2.5是指大气颗粒物(PM),其直径小于或等于2.5微米。在环境科学中,特指悬浮在空气中的固体颗粒或液滴,是空气污染的主要来源之一。 本文旨在探寻中国五大城市的PM2.5指数的数据情况及变化趋势,发现一些潜在规律并试图找到和PM2.5相关的一些天气因素。

数据整理和清洗

文中采用的数据集下载自Kaggle,基础数据如下:

先使用python对数据集进行了整理,将五张数据表合并为一张表,并删除暂不分析的数据,然后进行数据清洗,剔除其中为NA的数据。 合并后数据格式如下:

其中 PM_US_Post表示PM2.5的数值,时间精确到小时,使用 year、month、day、hour共同描述,即每一天有24条记录, 还有一些字段是专业数据我们会在后面介绍

使用python做了基础数据整理后,我们再使用Tableau进行可视化分析展示 我们先来看一下2010年至2015年,这五大城市的PM2.5指数的大体趋势情况:

var divElement = document.getElementById('viz1540953014407'); var vizElement = divElement.getElementsByTagName('object')[0]; vizElement.style.width='100%';vizElement.style.height=(divElement.offsetWidth*0.75)+'px'; var scriptElement = document.createElement('script'); scriptElement.src = 'https://public.tableau.com/javascripts/api/viz_v1.js'; vizElement.parentNode.insertBefore(scriptElement, vizElement);

上图可见,截至2015年,五大城市中,以北京PM2.5指数值最高,广州的PM2.5的指数值最低。 北京、上海、广州、成都自2013年以来PM2.5指数值都持续有所下降,唯独沈阳2013年PM2.5指数升高,目前已经排名第二位。

总体来说PM2.5的指数有所下降,环境问题得到了改善。

让我们再聚焦到2015年,看看PM2.5的数据情况:

var divElement = document.getElementById('viz1540882921951'); var vizElement = divElement.getElementsByTagName('object')[0]; vizElement.style.width='100%';vizElement.style.height=(divElement.offsetWidth*0.75)+'px'; var scriptElement = document.createElement('script'); scriptElement.src = 'https://public.tableau.com/javascripts/api/viz_v1.js'; vizElement.parentNode.insertBefore(scriptElement, vizElement);

上图可见,在采样数据基本均匀的情况下,五城市在不同季节呈现出了明显的差异。 在夏季各地的空气质量都是比较不错的,表现最差的北京在夏季PM2.5的平均值也能达到50, 而到了冬季,各地的污染指数都远大于夏季,北京的PM2.5均值达到了120。

我们在来看看具体到每月的情况:

var divElement = document.getElementById('viz1540883707822'); var vizElement = divElement.getElementsByTagName('object')[0]; vizElement.style.width='100%';vizElement.style.height=(divElement.offsetWidth*0.75)+'px'; var scriptElement = document.createElement('script'); scriptElement.src = 'https://public.tableau.com/javascripts/api/viz_v1.js'; vizElement.parentNode.insertBefore(scriptElement, vizElement);

PM2.5的分级标准为:优 35微克(ug)/每立方

良 35~75微克(ug)/每立方

轻度污染 75~115微克(ug)/每立方

中度污染 115~150微克(ug)/每立方

重度污染 150~250微克(ug)/每立方

严重污染 250及以上微克(ug)/每立方

上图可见,拥有最多优质天气的城市是广州,6月份中收获了29个优质天气,全年优质天气最多的月份在九月。而拥有最多严重污染的城市是北京,在12月有8天达到了严重污染。12月也是全年中空气质量最差的一个月。

既然这样,我们就试着分析一下,北京的空气质量这么差到底与哪些因素有关。 我们先看一下北京全年的PM2.5指数及相关几个系数的走势图:

var divElement = document.getElementById('viz1540953974930'); var vizElement = divElement.getElementsByTagName('object')[0]; vizElement.style.width='100%';vizElement.style.height=(divElement.offsetWidth*0.75)+'px'; var scriptElement = document.createElement('script'); scriptElement.src = 'https://public.tableau.com/javascripts/api/viz_v1.js'; vizElement.parentNode.insertBefore(scriptElement, vizElement);

这里我们先了解几个指标系数: 1. DEWP: 露点 2. TEMP: 温度 3. PRES:气压 4. cbwd: 组合风向 5. Iws: 累积风速 6. HUMI:湿度 7. precipitation:降水

依据上图我们简单可以看出,PM2.5的走势跟露点、湿度变化的走势是比较吻合的,而和累计风速则成反向变动。所以我们看在夏季,虽然露点和湿度的曲线变化比较大,但因为风力平稳持续,所以PM2.5曲线平稳。到了冬季大部分日子风力比较弱,PM2.5曲线同露点和湿度曲线变化就非常贴近了。

我们选取1月份PM2.5数值最大的一天,来看看当天的数据变化情况:

var divElement = document.getElementById('viz1540886857333'); var vizElement = divElement.getElementsByTagName('object')[0]; vizElement.style.width='100%';vizElement.style.height=(divElement.offsetWidth*0.75)+'px'; var scriptElement = document.createElement('script'); scriptElement.src = 'https://public.tableau.com/javascripts/api/viz_v1.js'; vizElement.parentNode.insertBefore(scriptElement, vizElement);

上图可见13时为全天PM指数最高时段,同时露点和湿度也是峰值,而此时风力相对较小。而风力最大时段是在上午8时,此时PM指数全天最小。 PM2.5确实是个很大的课题,专业程度又比较高,基于目前的字段信息就先分析到这里了,期待后续有了更多的知识和技术积累,能分析出更多有意义的观点了。及变化趋势,发现一些潜在规律并试图找到和PM2.5相关的一些天气因素。

## 数据整理和清洗

文中采用的数据集下载自Kaggle,基础数据如下:

先使用python对数据集进行了整理,将五张数据表合并为一张表,并删除暂不分析的数据,然后进行数据清洗,剔除其中为NA的数据。

合并后数据格式如下:

其中 PM_US_Post表示PM2.5的数值,时间精确到小时,使用 year、month、day、hour共同描述,即每一天有24条记录, 还有一些字段是专业数据我们会在后面介绍

使用python做了基础数据整理后,我们再使用Tableau进行可视化分析展示

我们先来看一下2010年至2015年,这五大城市的PM2.5指数的大体趋势情况:

上图可见,截至2015年,五大城市中,以北京PM2.5指数值最高,广州的PM2.5的指数值最低。

北京、上海、广州、成都自2013年以来PM2.5指数值都持续有所下降,唯独沈阳2013年PM2.5指数升高,目前已经排名第二位。

总体来说PM2.5的指数有所下降,环境问题得到了改善。

让我们再聚焦到2015年,看看PM2.5的数据情况:

上图可见,在采样数据基本均匀的情况下,五城市在不同季节呈现出了明显的差异。

在夏季各地的空气质量都是比较不错的,表现最差的北京在夏季PM2.5的平均值也能达到50, 而到了冬季,各地的污染指数都远大于夏季,北京的PM2.5均值达到了120。

我们在来看看具体到每月的情况:

PM2.5的分级标准为:

1. 优 35微克(ug)/每立方

2. 良 35~75微克(ug)/每立方

3. 轻度污染 75~115微克(ug)/每立方

4. 中度污染 115~150微克(ug)/每立方

5. 重度污染 150~250微克(ug)/每立方

6. 严重污染 250及以上微克(ug)/每立方

上图可见,拥有最多优质天气的城市是广州,6月份中收获了29个优质天气,全年优质天气最多的月份在九月。而拥有最多严重污染的城市是北京,在12月有8天达到了严重污染。12月也是全年中空气质量最差的一个月。

既然这样,我们就试着分析一下,北京的空气质量这么差到底与哪些因素有关。

我们先看一下北京全年的PM2.5指数及相关几个系数的走势图:

这里我们先了解几个指标系数:

1. DEWP: 露点

2. TEMP: 温度

3. PRES:气压

4. cbwd: 组合风向

5. Iws: 累积风速

6. HUMI:湿度

7. precipitation:降水

依据上图我们简单可以看出,PM2.5的走势跟露点、湿度变化的走势是比较吻合的,而和累计风速则成反向变动。所以我们看在夏季,虽然露点和湿度的曲线变化比较大,但因为风力平稳持续,所以PM2.5曲线平稳。到了冬季大部分日子风力比较弱,PM2.5曲线同露点和湿度曲线变化就非常贴近了。

我们选取1月份PM2.5数值最大的一天,来看看当天的数据变化情况:

上图可见13时为全天PM指数最高时段,同时露点和湿度也是峰值,而此时风力相对较小。而风力最大时段是在上午8时,此时PM指数全天最小。

PM2.5确实是个很大的课题,专业程度又比较高,基于目前的字段信息就先分析到这里了,期待后续有了更多的知识和技术积累,能分析出更多有意义的观点了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值