一元多次线性回归案例-IT行业收入模型分析

案例一:

需求

分析IT行业工龄和收入之间的规律。通常来说,收入都会随着工作年限的增长而增长,而在不同的行业中收入的 增长速度都会有所不同,本需求就是来通过一元线性回归模型来探寻工作年 限对收入的影响,也即搭建收入预测模型,同时比较多个行业的收入预测模 型来分析各个行业的特点。

数据

线性回归-一元一次线型回归-CSDN博客

代码

# 【1】导入资源包
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
import pandas as pd

# 【2】加载样本数据,核心是给x,y赋值

df = pd.read_excel('IT行业收入表.xlsx')
print(df.head())

x = df[['工龄']]
y = df['薪水']

#【2.1】多项式数据转变 y = ax^2+bx+c
from sklearn.preprocessing import PolynomialFeatures
pf = PolynomialFeatures(degree=2)
x2 = pf.fit_transform(x)
print(x2)


#【3】模型搭建
lr = LinearRegression()

#【4】模型训练
lr.fit(x2,y)

#【5】模型预测
res = lr.predict(pf.fit_transform([[10]]))
print(res)

#拓展
#【6】显示模型参数
print('回归系数:',str(lr.coef_))
print('截距:',str(lr.intercept_))
print('模型函数: y = ',str(lr.coef_[2]),'*x^2 +(',str(lr.coef_[1]),'*x) +',str(lr.intercept_))

#【7】样本及模型可视化
plt.scatter(x,y)
plt.plot(x,lr.predict(pf.fit_transform(x)))
# plt.plot(x,lr.predict(x2))
plt.show()

#【8】模型评估
import statsmodels.api as sma
res = sma.OLS(y,sma.add_constant(x2)).fit()
print(res.summary())
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

数智侠

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值