多元线性回归,即多个变量对目标值的影响(Y=aX1+bX2+cX3…+z);接下来分析下“店铺面积”和“距离最近的车站”对便利店“月营业额”的影响,并预测店铺的月营业额。
数据准备如下:
代码如下,自行消化:
from pandas import read_csv
from sklearn.linear_model import LinearRegression
#读取数据
data = read_csv('data1.csv',encoding='gbk')
x = data[["店铺的面积", "距离最近的车站"]]
y = data[["月营业额"]]
#y与各个变量的相关系数
print(data.corr())
#建模
Model = LinearRegression()
#训练模型
Model.fit(x, y)
#评分
print(Model.score(x, y))
#预测
print(Model.predict([[10, 110],[20, 110]]))
#查看参数(斜率)
print(Model.coef_)
#查看截距
print(Model.intercept_)
结果:
结果我们可以看出,月营业额与店铺面积呈正相关关系,与距离最近的车站呈负相关关系。
其实过程跟一元线性回归分析的方法一样,只是变量多了而已。
在学习的过程中,你会发现以上学的都是皮毛,真正的数据分析是要经过不断的训练,对变量的取舍,对数据的拟合等,最终取得最优解…说的我都懵了,后面继续学习吧。
感悟:大部分人都想象自己是超人、救世主,但最终我们都归于平凡或平庸。