数据挖掘之回归分析

本博客根据非常好的excel资料而编写,使用python语言操作,预计使用一周的时间更新完成。需要《非常好的excel资料》word文档,欢迎发邮件给1982500361@qq.com,免费发放。这篇博客对应《非常好的excel资料》里的第6章节。

1.1 一元线性回归分析

①数据
在这里插入图片描述
python操作

import pandas as pd
ex61=pd.read_csv('D:\ins61.csv',encoding='gbk')
x =pd.to_numeric(ex61['X'][0:26])
y = pd.to_numeric(ex61['Y'][0:26])
from statsmodels.formula.api import ols
import pandas as pd
data = pd.DataFrame({'x':x, 'y':y})
model = ols('y~x', data).fit()
print(model.summary())

结果图
在这里插入图片描述

1.2 多元线性回归分析

数据

在这里插入图片描述
python代码

import pandas as pd
import numpy as np
import statsmodels.api as sm
from pandas import DataFrame
ex61=pd.read_csv('D:\ins61.csv',encoding='gbk')
y=pd.to_numeric(ex61['Y1'][0:15])
X=ex61[['X1','X2','X3','X4']][0:15]
X=pd.DataFrame(X,dtype=np.float)  #将dataframe里的值转成float
#y=pd.to_numeric(ex61['Y1'])
X=sm.add_constant(X)
est=sm.OLS(y,X).fit()
est.summary()

结果图
在这里插入图片描述
可以看出Y = 1.454409X1+0.549593X2+0.067714X3-0.08167X4+59.68807
因为90.99643>8.02×〖10〗^8 ,所以多元线性回归显著。
上一篇:数据挖掘之方差分析实验
下一篇:数据挖掘之多元线性回归练习题

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值