AQI分析与预测

背景信息

AQI,指空气质量指数,用来衡量空气清洁或者污染程度,值越小,表示空气质量越好。

任务说明

  1. 哪些城市的空气质量较好/较差?
  2. 临海城市是否空气质量优于内陆城市?
  3. 空气质量主要受哪些因素影响
  4. 是否可以预测城市的空气质量?
  5. 是否可以预测城市是否临海?

数据集描述

我们现在获取了2015年空气质量指数集。该数据集包含全国主要城市的相关数据以及空气质量指数

列名 含义
City 城市名
AQI 空气质量指数
Precipitation 降雨量
GDP 城市生产总值
Temperature 温度
Longitude 经度
Latitude 纬度
Altitude 海拔高度
PopulationDensity 人口密度
Coastal 是否沿海
GreenCoverageRate 绿化覆盖率
Incineration(10,000ton) 焚烧量(10000吨)

加载相关的数据集

import numpy as np
import pandas as pd
import matplotlib as mpl
import matplotlib.pyplot as plt
import warnings
import seaborn as sns
sns.set(style="darkgrid", font="SimHei", rc={"axes.unicode_minus": False})
warnings.filterwarnings("ignore")
data = pd.read_csv("CompletedDataset.csv")
print(data.shape)
data.head()

数据清洗

数据清洗也就是去除那三个方面的值,这里不再赘述,直接上代码

data.info()
# data.isnull().sum(axis=0)
//异常值处理
# data.describe()
sns.boxplot(data=data["Precipitation"])
//重复值处理
//使用duplicate检查重复值。可配合keep参数进行调整。
//使用drop_duplicate删除重复值
data.duplicated().sum()

数据分析

空气质量最好/最差的五个城市

最好的5个城市

t = data[["City", "AQI"]].sort_values("AQI")
display(t.iloc[:5])
sns.barplot(x="City", y="AQI", data=t.iloc[:5])

最差的5个城市

display(t.iloc[-5:])
sns.barplot(x="City", y="AQI", data=t.iloc[-5:])

临海城市是否空气质量优于内陆城市?

display(data["Coastal"].value_counts())
sns.countplot(x="Coastal", data=data)

然后,我们来观察一下临海城市与内陆城市的散点分布

sns.swarmplot(x="Coastal", y="AQI", data=data)

然后,我们再来分组计算空气质量的均值

display(data.groupby("Coastal")["AQI"].mean())
sns.barplot(x="Coastal", y="AQI", data=data)

柱形图仅能进行均值对比,我们可以使用箱线图来显示更多的信息

sns.boxplot(x="Coastal", y="AQI", data=data)

我们也可以绘制小提琴图,除了能够展示箱线图的信息外,还能呈现出分布的密度

sns.violinplot(x="Coastal", y="AQI", data=data)

我们可以将散点与箱线图或小提琴图结合在一起进行绘制,下面以小提琴图为例

sns.violinplot(x="Coastal", y="AQI", data=data, inner=None)

sns.swarmplot(x="Coastal", y="AQI", color="g", data=data)

空气质量主要受哪些因素影响?

data.corr()

由于我们的数据只是抽样过来的数据,所以使用的就是抽样数据,那么数据能不能反应出整体的效果呢?这个是我们不知道的,那么我们可以使用两种方式去检验自己数据的可信度,一个是正太分布,第二个就是t检验,这俩数学知识就考验自己的大学功底了!!!!!

对空气质量进行预测,或者对是否临海进行预测,用到了相关系数等等数学术语,这里不再赘述,两篇写完感觉不到哪里是人工智能,只能当作数据分析!!!!

 

 

 

评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值