随着国内经济的发展,人们对于空气的质量越来越关注,另一方面,大数据时代的来临给各行各业带来了巨大的影响,因此开发一款基于Python的空气质量检测系统数据分析可视化系统,该系统结合了大数据处理技术与前端可视化工具,旨在从海量数据中提取有价值的信息。该系统以Python为主要开发语言,结合Hadoop、Spark等大数据处理技术,以及Vue.js、Echarts等前端可视化工具。系统是一款基于B/S的web应用,首先通过爬虫技术从2345天气网获取天气数据,包括城市、最高温、最低温、风力等,并利用Pandas进行数据清洗和预处理,然后展示了天气类别统计、温度统计、空气质量数量统计等可视化数据,最后利用决策树机器学习算法预测了未来15天的天气情况。希望本系统能够帮助用户快速了解各地的空气质量情况,也为相关行业提供决策支持。
系统相关的页面较多,包括有注册与登录页面,首页,空气质量地图页,可视化图表页,用户管理页,数据管理页。首页包括有6种可视化的图表,分别是:天气类别统计,温度统计、空气质量数量统计、主要城市AQI平均值、15天气温预测和城市统计。另外在管理页面的可视化图表栏中又有四种图表,分别是:最高温度统计,最小温度统计,风向统计和天气统计。
图4.2系统页面组成图
系统通过机器学习和训练之后,可以根据天气的具体特色,比如历史温度等预测未来15天气温预测,只需要在预测栏中填写城市,点击预测即可,如下图所示。
图5.5气温预测界面图