实现思路
1.搭建机器学习开环境,Python, anaconda等。
2.数据采集,用电量数据、环境污染采集数据。
3.特征提取方法。
4.用关联分析、聚类算法分析用电量与空气污染指数关系。
5.数据结果及可视化。
实践要求
(1)功能完备,覆盖选题中的各项要求;未提及的内容,按照该题目基本原理及实际应有功能、性能要求进行设计、实现和测试验证,考虑尽可能全面、深入、细致。
(2)设计类题目如无特殊说明必须有图形用户界面
(3)开发语言和工具不限,尽量使用最新版本;
研究方法介绍
本研究将采用机器学习开发环境,使用Python、Anaconda,通过特征提取,建立linear_model , svm以及GBRT模型进行数据分析。
Anaconda(大蟒蛇)
Anaconda是一个安装、管理python相关包的软件,还自带python、Jupyter Notebook、Spyder,其中有管理包的conda工具。Anaconda指的是一个开源的Python发行版本,其包含了conda、Python等180多个常用数据科学包及其依赖项。其中包括Conda、Python以及一大堆安装好的工具包,比如:numpy、pandas等。
Anaconda 是在 Conda(⼀个包管理器和环境管理器)上发展出来的,而Conda是一个开源的包、环境管理器,可以帮助你在计算机上安装和管理数据分析相关包,可以用于在同一个机器上安装不同版本的软件包及其依赖,并能够在不同的环境之间切换。
作业使用三