第一、回归分析的步骤
01 根据预测目标,确定自变量和因变量
02 绘制散点图,确定回归模型类型
03 估计模型参数,建立回归模型
04 对回归模型进行检验
回归方程的精度就是用来表示实际观测点和回归方程的拟合程度的指标,使用判定系数来度量。
判定系数=相关系数R平方=ESS/TSS=1-RSS/TSS
其中:具体公式见图
TSS 总离差平方和
ESS 回归平方和
RSS 残差平方和
05 利用回归模型进行预测
第二、sklearn 建模
leModel=sklearn.linear_model.LinearRegression()
训练模型:
lrModel.fit(x,y)
模型评估:
lrModel.score(x,y)
模型预测:
lrModel.predict(x)
第三、代码实践
import numpy
import pandas
data = pandas.read_csv('D:\\DATA\\pycase\\number2\\Data2.csv')
# 根据预测目标,确定自变量现金和因变量流水
# 0 确定自变量因素,对数据标签进行维度的合并,此处按照渠道序列筛选分组统计(因为有跨期影响)
Data=data.groupby(
by=['广告商']
)['现金','流水'].agg({