pandas 常用回归模型总结

简单线性回归:

一个因变量一个自变量

公式: y = a + bx + e  常数项: a  回归系数:b   随机误差:e

from sklearn.linear_model import LinearRegression 从sklearn中导入线性回归模型

model = LinearRegression()   创建模型

model.fit(x, y)  使用自变量和因变量对模型进行训练

model.score(x, y) 使用自变量和因变量对模型进行评分

model.predict()  输入参数进行预测

多重线性回归:

一个因变量和多个自变量

公式:y =  a + b1X1 + b2X2 + 。。。bnXn + e  常数项: a  偏回归系数:bn   随机误差:e

导入的包和建模训练过程和简单线性回归相同。

一元非线性回归分析:

一个因变量一个自变量

公式:

表现为一元n次方程   y = aX ² + bX ¹ + c X º

求解方法:将一元非线性回归方程转化为多重线性回归(多元一次)方程

from sklearn.linear_model import LinearRegression 从sklearn中导入线性回归模型

from sklearn.preprocessing import PolynomialFeatures  从sklearn中导入处理一元非线性回归方程输入参数的预处理包

po = PolynomialFeatures(degree=n)  创建预处理类 n为一元n次方程的最高次数

fit_x = po. fit_transform(x) 将原参数x转换成为新的fit_x

model = LinearRegression()  创建线性回归模型

model.fit(fit_x, y)  使用转换自变量和因变量对模型进行训练

model.scroe(fit_x, y) 使用转换自变量和因变量对模型进行评分

model.predict(po. fit_transform())  输入转换参数进行预测

逻辑回归:

针对因变量为分类变量进行回归分析的统计方法,算法易于实现和部署,执行效率和准确率高

查看数据中的离散型特征:

       1:离散型特征没有大小意义:例如性别

              pandas.get_dummies() 进行虚拟变量转化同时参数 drop_first=True来消除共线性

       2:离散型特征存在大小意义:例如学历

              将数据中的所有存在大小意义的数据用数字进行大小表示

from sklearn.linear_model import LogisticRegression   从sklearn线性模型中导入逻辑回归模型

model = LogisticRegression() 创建模型

model.fit(x , y) 将进行虚拟化后筛选出的特征自变量输入模型,因变量输入,进行模型训练

model.score (x , y)  模型评分

model. predict (x1)  将进行同样虚拟化的特征参数输入模型进行预测

  • 2
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值