1、回归分析分类
包括线性回归、非线性回归、逻辑回归(0和1)、岭回归、主成分分析,最后两个参与建模的自变量之间具有多重共线性,但是岭回归的X非常多
2、一元线性回归建模
比如:淘宝某商品的总销量和收藏数的一元线性回归
第一步:绘制散点图看数据是否有异常数据
Yvar=df[因变量名称]
Xvar=df[自变量名称]
plt.scatter(Xvar,Yvar)
去除异常点后重新做散点图检验
再做散点图时要加上拟合线:
plt.plot(x1,y,“r”)
第二步:一元线性回归建模-OLS最小二乘法
import statmodels.api as sm
Y=Yvar.values
X=Xvar.values
X=sm.add_constant(X) #因为OLS没有常数项,也就没有b,这个操作可加上常数项
lm=sm.OLS(Y,X).fit()
print("因变量:因变量列名称”)
print(“自变量:自变量列名称”)
print("==========一元线性回归结果====