PM2.5大家一定都不会陌生,特别是在北京生活的小伙伴们。PM2.5是指大气颗粒物(PM),其直径小于或等于2.5微米。在环境科学中,特指悬浮在空气中的固体颗粒或液滴,是空气污染的主要来源之一。
本文旨在探寻中国五大城市的PM2.5指数的数据情况@中国五城市PM2.5数据解读
PM2.5大家一定都不会陌生,特别是在北京生活的小伙伴们。PM2.5是指大气颗粒物(PM),其直径小于或等于2.5微米。在环境科学中,特指悬浮在空气中的固体颗粒或液滴,是空气污染的主要来源之一。 本文旨在探寻中国五大城市的PM2.5指数的数据情况及变化趋势,发现一些潜在规律并试图找到和PM2.5相关的一些天气因素。
数据整理和清洗
文中采用的数据集下载自Kaggle,基础数据如下:
先使用python对数据集进行了整理,将五张数据表合并为一张表,并删除暂不分析的数据,然后进行数据清洗,剔除其中为NA的数据。 合并后数据格式如下:
其中 PM_US_Post表示PM2.5的数值,时间精确到小时,使用 year、month、day、hour共同描述,即每一天有24条记录, 还有一些字段是专业数据我们会在后面介绍
使用python做了基础数据整理后,我们再使用Tableau进行可视化分析展示 我们先来看一下2010年至2015年,这五大城市的PM2.5指数的大体趋势情况:
var divElement = document.getElementById('viz1540953014407'); var vizElement = divElement.getElementsByTagName('object')[0]; vizElement.style.width='100%';vizElement.style.height=(divElement.offsetWidth*0.75)+'px'; var scriptElement = document.createElement('script'); scriptElement.src = 'https://public.tableau.com/javascripts/api/viz_v1.js'; vizElement.parentNode.insertBefore(scriptElement, vizElement);
上图可见,截至2015年,五大城市中,以北京PM2.5指数值最高,广州的PM2.5的指数值最低。 北京、上海、广州、成都自2013年以来PM2.5指数值都持续有所下降,唯独沈阳2013年PM2.5指数升高,目前已经排名第二位。
总体来说PM2.5的指数有所下降,环境问题得到了改善。
让我们再聚焦到2015年,看看PM2.5的数据情况:
var divElement = document.getElementById('viz1540882921951'); var vizElement = divElement.getElementsByTagName('object')[0]; vizElement.style.width='100%';vizElement.style.height=(divElement.offsetWidth*0.75)+'px'; var scriptElement = document.createElement('script'); scriptElement.src = 'https://public.tableau.com/javascripts/api/viz_v1.js'; vizElement.parentNode.insertBefore(scriptElement, vizElement);
上图可见,在采样数据基本均匀的情况下,五城市在不同季节呈现出了明显的差异。 在夏季各地的空气质量都是比较不错的,表现最差的北京在夏季PM2.5的平均值也能达到50, 而到了冬季,各地的污染指数都远大于夏季,北京的PM2.5均值达到了120。
我们在来看看具体到每月的情况:
var divElement = document.getElementById('viz1540883707822'); var vizElement = divElement.getElementsByTagName('object')[0]; vizElement.style.width='100%';vizElement.style.height=(divElement.offsetWidth*0.75)+'px'; var scriptElement = document.createElement('script'); scriptElement.src = 'https://public.tableau.com/javascripts/api/viz_v1.js'; vizElement.parentNode.insertBefore(scriptElement, vizElement);
PM2.5的分级标准为:优 35微克(ug)/每立方
良 35~75微克(ug)/每立方
轻度污染 75~115微克(ug)/每立方
中度污染 115~150微克(ug)/每立方
重度污染 150~250微克(ug)/每立方
严重污染 250及以上微克(ug)/每立方
上图可见,拥有最多优质天气的城市是广州,6月份中收获了29个优质天气,全年优质天气最多的月份在九月。而拥有最多严重污染的城市是北京,在12月有8天达到了严重污染。12月也是全年中空气质量最差的一个月。
既然这样,我们就试着分析一下,北京的空气质量这么差到底与哪些因素有关。 我们先看一下北京全年的PM2.5指数及相关几个系数的走势图:
var divElement = document.getElementById('viz1540953974930'); var vizElement = divElement.getElementsByTagName('object')[0]; vizElement.style.width='100%';vizElement.style.height=(divElement.offsetWidth*0.75)+'px'; var scriptElement = document.createElement('script'); scriptElement.src = 'https://public.tableau.com/javascripts/api/viz_v1.js'; vizElement.parentNode.insertBefore(scriptElement, vizElement);
这里我们先了解几个指标系数: 1. DEWP: 露点 2. TEMP: 温度 3. PRES:气压 4. cbwd: 组合风向 5. Iws: 累积风速 6. HUMI:湿度 7. precipitation:降水
依据上图我们简单可以看出,PM2.5的走势跟露点、湿度变化的走势是比较吻合的,而和累计风速则成反向变动。所以我们看在夏季,虽然露点和湿度的曲线变化比较大,但因为风力平稳持续,所以PM2.5曲线平稳。到了冬季大部分日子风力比较弱,PM2.5曲线同露点和湿度曲线变化就非常贴近了。
我们选取1月份PM2.5数值最大的一天,来看看当天的数据变化情况:
var divElement = document.getElementById('viz1540886857333'); var vizElement = divElement.getElementsByTagName('object')[0]; vizElement.style.width='100%';vizElement.style.height=(divElement.offsetWidth*0.75)+'px'; var scriptElement = document.createElement('script'); scriptElement.src = 'https://public.tableau.com/javascripts/api/viz_v1.js'; vizElement.parentNode.insertBefore(scriptElement, vizElement);
上图可见13时为全天PM指数最高时段,同时露点和湿度也是峰值,而此时风力相对较小。而风力最大时段是在上午8时,此时PM指数全天最小。 PM2.5确实是个很大的课题,专业程度又比较高,基于目前的字段信息就先分析到这里了,期待后续有了更多的知识和技术积累,能分析出更多有意义的观点了。及变化趋势,发现一些潜在规律并试图找到和PM2.5相关的一些天气因素。
## 数据整理和清洗
文中采用的数据集下载自Kaggle,基础数据如下:
先使用python对数据集进行了整理,将五张数据表合并为一张表,并删除暂不分析的数据,然后进行数据清洗,剔除其中为NA的数据。
合并后数据格式如下:
其中 PM_US_Post表示PM2.5的数值,时间精确到小时,使用 year、month、day、hour共同描述,即每一天有24条记录, 还有一些字段是专业数据我们会在后面介绍
使用python做了基础数据整理后,我们再使用Tableau进行可视化分析展示
我们先来看一下2010年至2015年,这五大城市的PM2.5指数的大体趋势情况:
上图可见,截至2015年,五大城市中,以北京PM2.5指数值最高,广州的PM2.5的指数值最低。
北京、上海、广州、成都自2013年以来PM2.5指数值都持续有所下降,唯独沈阳2013年PM2.5指数升高,目前已经排名第二位。
总体来说PM2.5的指数有所下降,环境问题得到了改善。
让我们再聚焦到2015年,看看PM2.5的数据情况:
上图可见,在采样数据基本均匀的情况下,五城市在不同季节呈现出了明显的差异。
在夏季各地的空气质量都是比较不错的,表现最差的北京在夏季PM2.5的平均值也能达到50, 而到了冬季,各地的污染指数都远大于夏季,北京的PM2.5均值达到了120。
我们在来看看具体到每月的情况:
PM2.5的分级标准为:
1. 优 35微克(ug)/每立方
2. 良 35~75微克(ug)/每立方
3. 轻度污染 75~115微克(ug)/每立方
4. 中度污染 115~150微克(ug)/每立方
5. 重度污染 150~250微克(ug)/每立方
6. 严重污染 250及以上微克(ug)/每立方
上图可见,拥有最多优质天气的城市是广州,6月份中收获了29个优质天气,全年优质天气最多的月份在九月。而拥有最多严重污染的城市是北京,在12月有8天达到了严重污染。12月也是全年中空气质量最差的一个月。
既然这样,我们就试着分析一下,北京的空气质量这么差到底与哪些因素有关。
我们先看一下北京全年的PM2.5指数及相关几个系数的走势图:
这里我们先了解几个指标系数:
1. DEWP: 露点
2. TEMP: 温度
3. PRES:气压
4. cbwd: 组合风向
5. Iws: 累积风速
6. HUMI:湿度
7. precipitation:降水
依据上图我们简单可以看出,PM2.5的走势跟露点、湿度变化的走势是比较吻合的,而和累计风速则成反向变动。所以我们看在夏季,虽然露点和湿度的曲线变化比较大,但因为风力平稳持续,所以PM2.5曲线平稳。到了冬季大部分日子风力比较弱,PM2.5曲线同露点和湿度曲线变化就非常贴近了。
我们选取1月份PM2.5数值最大的一天,来看看当天的数据变化情况:
上图可见13时为全天PM指数最高时段,同时露点和湿度也是峰值,而此时风力相对较小。而风力最大时段是在上午8时,此时PM指数全天最小。
PM2.5确实是个很大的课题,专业程度又比较高,基于目前的字段信息就先分析到这里了,期待后续有了更多的知识和技术积累,能分析出更多有意义的观点了。