介绍
本文实现了导入库、获取数据、数据预处理、数据展示分析、数据建模、模型评估、销售预测 7个步骤。
用到的知识:
- Python文件读取
- Python基本操作(新建、追加)、for循环、变量赋值、字符串分割、数值转换
- Numpy数组操作:列表转数组、重新设置数组形状
- 使用Matplotlib进行散点图展示
- 使用Sklearn进行线性回归的训练和预测
简单线性回归
线性回归是数据挖掘中的基础算法之一,从某种意义上来说,在学习函数的时候已经开始接触线性回归了,只不过那时候并没有涉及到误差项。线性回归的思想其实就是解一组方程,得到回归函数,不过在出现误差项之后,方程的解法就存在了改变,一般使用最小二乘法进行计算。
sklearn.linear_model.LinearRegression进行线性回归
可以使用fit、predict、