线性回归预测模型

本文详细介绍了线性回归模型,包括一元线性回归和多元线性回归的概念,以及如何利用基本语法和statsmodels库进行求解。接着,文章探讨了回归模型的假设检验,如F检验和t检验,用于评估模型显著性和回归系数的显著性。最后,文章讨论了回归模型的诊断,包括正态性检验,通过直方图、PP图、QQ图和Shapiro检验来验证残差的正态性。
摘要由CSDN通过智能技术生成

一元线性回归模型:

在这里插入图片描述
ε:模型误差项,平衡等号两边值

import seaborn as sns
income = pd.read_csv(r'Salary_Date.csv')
sns.lmplot(x='YearExperience',y='Salary',
			data=income,ci=None)
plt.show()

在这里插入图片描述
线性拟合求解:
误差项最小,转换为误差平方项最小
在这里插入图片描述
最小时,偏导数为0
在这里插入图片描述
在这里插入图片描述
①使用基本语法求解

n = income.shape[0]
sum_x = income.YearsExperience.sum()
sum_y = income.Salary.sum()
sum_x2 = income.YearsExperience.pow(2).sum()
xy = income.YearsExperience * income.Salary
sum_xy = xy.sum()
b = (sum_xy - sum_x * sum_y / n) / (sum_x2 - sum_x ** 2 / n)
a = sum_y.mean() - b * sum_x.mean()

②使用statsmodels中的ols函数
ols(formula,data,subset=None,drop_cols)
formula:‘y~x’
subset:bool类型,子集建模

import statsmodels.api as sm
fit = sm.formula.ols('income.Salary ~ income.YearsExperience',data=income).fit()
fit.params

在这里插入图片描述

多元线性回归

构建多元线性回归的数据集包含n个观测,p+1个变量(p个自变量,1个因变量)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值