线性回归预测模型

最新推荐文章于 2024-06-06 23:15:00 发布

菀青

最新推荐文章于 2024-06-06 23:15:00 发布

阅读量4.6k

点赞数 4

分类专栏：数据可视化文章标签：线性回归

本文链接：https://blog.csdn.net/qq_32733847/article/details/98341657

版权

本文详细介绍了线性回归模型，包括一元线性回归和多元线性回归的概念，以及如何利用基本语法和statsmodels库进行求解。接着，文章探讨了回归模型的假设检验，如F检验和t检验，用于评估模型显著性和回归系数的显著性。最后，文章讨论了回归模型的诊断，包括正态性检验，通过直方图、PP图、QQ图和Shapiro检验来验证残差的正态性。

摘要由CSDN通过智能技术生成

一元线性回归模型：

在这里插入图片描述
ε：模型误差项，平衡等号两边值

import seaborn as sns
income = pd.read_csv(r'Salary_Date.csv')
sns.lmplot(x='YearExperience',y='Salary',
			data=income,ci=None)
plt.show()

在这里插入图片描述
线性拟合求解：
误差项最小，转换为误差平方项最小

最小时，偏导数为0

①使用基本语法求解

n = income.shape[0]
sum_x = income.YearsExperience.sum()
sum_y = income.Salary.sum()
sum_x2 = income.YearsExperience.pow(2).sum()
xy = income.YearsExperience * income.Salary
sum_xy = xy.sum()
b = (sum_xy - sum_x * sum_y / n) / (sum_x2 - sum_x ** 2 / n)
a = sum_y.mean() - b * sum_x.mean()

②使用statsmodels中的ols函数
ols(formula,data,subset=None,drop_cols)
formula：‘y~x’
subset：bool类型，子集建模

import statsmodels.api as sm
fit = sm.formula.ols('income.Salary ~ income.YearsExperience',data=income).fit()
fit.params

在这里插入图片描述

多元线性回归

构建多元线性回归的数据集包含n个观测，p+1个变量（p个自变量，1个因变量）

最低0.47元/天解锁文章

菀青

关注

4
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录