PM2.5大家一定都不会陌生,特别是在北京生活的小伙伴们。PM2.5是指大气颗粒物(PM),其直径小于或等于2.5微米。在环境科学中,特指悬浮在空气中的固体颗粒或液滴,是空气污染的主要来源之一。
本文旨在探寻中国五大城市的PM2.5指数的数据情况及变化趋势,发现一些潜在规律并试图找到和PM2.5相关的一些天气因素。
数据整理和清洗
文中采用的数据集下载自Kaggle,基础数据如下:
先使用python对数据集进行了整理,将五张数据表合并为一张表,并删除暂不分析的数据,然后进行数据清洗,剔除其中为NA的数据。
合并后数据格式如下:
其中 PM_US_Post表示PM2.5的数值,时间精确到小时,使用 year、month、day、hour共同描述,即每一天有24条记录, 还有一些字段是专业数据我们会在后面介绍
使用python做了基础数据整理后,我们再使用Tableau进行可视化分析展示
我们先来看一下2010年至2015年,这五大城市的PM2.5指数的大体趋势情况: