机器学习 城市空气质量AQI的分析与预测

需要完整项目源码和论文报告可以私信我或加QQ1878073201
机器学习大作业–基于机器学习算法、KNN、SVM、LSTM、决策树、随机森林、线性回归分析对空气质量的分类、识别和预测:
本文针对江西省南昌市2022年空气质量问题,采用各种机器学习算法实现其分类、知识、预测等。文中采用了基于SVM的图像分类或归类、深度学习模型LSTM、决策树、随机森林和线性回归分析等方法,对南昌市空气质量进行了研究和预测,并综合分析了各种算法的优缺点和适用性,为南昌市及相关决策部门提供了有效的参考建议。
(可以自行改地区,通过爬虫源码爬取其他地区空气质量数据集)

所有可视化结果以aqi指数为x轴,当天aqi排名为y轴,颜色代表空气质量。green, yellow, orange,red, purple,black分别代表优,良,轻度污染,中度污染,重度污染,严重污染。

1.获取数据

1.1数据来源:
http://www.tianqihoubao.com/aqi/nanchang-202201.html
在这里插入图片描述
1.2爬虫源码:(完整源码见项目中:爬虫.py程序)

import pandas as pd
import logging

logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s: %(message)s')
for page in range(1, 13):  # 12个月
    if page < 10:
        url = f'http://www.tianqihoubao.com/aqi/nanchang-20220{page}.html'
        df = pd.read_html(url, encoding='gbk')[0]
        if page == 1:
            df.to_csv('空气质量-nanchang_day.csv', mode='a+', index=False, header=False)
        else:
            df.iloc[1:, ::].to_csv('空气质量-nanchang_day.csv', mode='a+', index=False, header=False)
    else:
        url = f'http://www.tianqihoubao.com/aqi/nanchang-2022{page}.html'
        df = pd.read_html(url, encoding='gbk')[0]
        df.iloc[1:, ::].to_csv('空气质量-nanchang_day.csv', mode='a+', index=False, header=False)

    logging.info(f'{page}月空气质量数据下载完成!')

1.3爬取数据:(数据集见空气质量-nanchang_day.csv文件)
在这里插入图片描述
1.4数据预处理:(源码见test.py程序,处理后的数据见data.txt文件)
在这里插入图片描述

2.数据分析

2.1.2022年南昌市空气质量分析中质量等级,AQI指数,当天AQI排名,PM2.5,PM10,So2,No2,Co,O3全年走势图:
![在这里插入图片描述](https://img-blog.csdnimg.cn/51c03ad6e60f4692a759523244dcc55b.png在这里插入图片描述
在这里插入图片描述
2.2.2022年南昌市空气质量分析中质量等级,AQI指数,当天AQI排名,PM2.5,PM10,So2,No2,Co,O3季度箱形图:在这里插入图片描述
在这里插入图片描述
2.2.2022年南昌市空气质量分析中质量等级,AQI指数,当天AQI排名,PM2.5,PM10,So2,No2,Co,O3月均走势图:
在这里插入图片描述
在这里插入图片描述

3.实验结果

3.1基于SVM的图像分类、归类和预测

关键代码:(源码见SVM.py程序)
在这里插入图片描述

可视化训练集的真实值:

在这里插入图片描述

可视化测试集的真实值:

在这里插入图片描述

可视化测试集的预测值:

在这里插入图片描述

模型的准确率:

在这里插入图片描述

在支持向量机模型中, degree 控制多项式特征的次数,它的值越大,模型的复杂度就越高。另外, C 参数控制了模型对误分类的惩罚力度,它的值越小,模型就越容易出现过拟合的情况。将 degree 参数调为10 和 C 设置为5出现过拟合。

以下是模型过拟合实验对比结果:
可视化训练集的真实值:

在这里插入图片描述

可视化测试集的真实值:

在这里插入图片描述

可视化测试集的预测值:

在这里插入图片描述

模型的准确率:

在这里插入图片描述

3.2深度学习模型LSTM
Lstm最优模型参数:(源代码见best_lstm.py程序)

3.3决策树

3.4随机森林

3.5 线性回归分析

3.6.KNN算法

内容太多不一一展示,需要完整项目源码和论文报告的可以私我。

  • 50
    点赞
  • 157
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 23
    评论
空气质量AQI数据分析预测可以通过以下几个步骤进行: 1. 首先,可以使用分组计算方法计算不同地区(如沿海和非沿海地区)的空气质量均值。可以使用以下代码实现:\[1\] ```python display(data.groupby('Coastal')\['AQI'\].mean()) ``` 这将显示不同地区的空气质量均值,并使用柱状图进行可视化。 2. 其次,可以找出空气质量最好和最差的城市。可以使用以下代码实现:\[2\] ```python t = data\[\['City', 'AQI'\]\].sort_values('AQI') display(t.iloc\[:5\]) # 最好的5个城市 ``` 这将显示空气质量最好的5个城市,并使用柱状图进行可视化。 3. 此外,可以使用散点图和箱线图或小提琴图来观察不同地区的空气质量分布。可以使用以下代码实现:\[3\] ```python sns.violinplot(x='Coastal', y='AQI', data=data, inner=None) sns.swarmplot(x='Coastal', y='AQI', color='g', data=data) ``` 这将显示不同地区的空气质量分布情况,并将散点图与箱线图或小提琴图组合在一起。 通过以上步骤,可以对空气质量AQI数据进行分析,并根据分析结果进行预测和进一步的研究。 #### 引用[.reference_title] - *1* *2* *3* [python 空气质量AQI数据分析预测 ---分析空气质量排名,临海城市空气质量是否优于内陆城市)](https://blog.csdn.net/YmeBtc/article/details/96438896)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论 23
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

黎明的前夜

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值