Python进行简单线性回归分析

本文介绍了如何使用Python的sklearn、pandas和statsmodels库进行线性回归分析,包括数据预处理、模型训练、添加截距项以及评估模型性能。作者展示了如何使用这些工具来预测火灾损失,通过决定系数和模型摘要了解回归结果。
摘要由CSDN通过智能技术生成

在这需要用到python的三个库:sklearn (全称 Scikit-Learn) 是基于 Python 语言的机器学习工具、pandas(进行数据采集)、statsmodels(统计模型)

from sklearn.linear_model import LinearRegression
import pandas as pd
import statsmodels.api as sm

导入sklearn.linear_model(线性模型)中LinearRegression

导入pandas

导入statsmodels.api(统计模型,其中包括各种方法,例如:OLS(最小二乘法))

# 创建数据
df = pd.read_excel(r'E:\\应用回归分析数据.xlsx')
x =  df['距离'].values.reshape(-1, 1)
y = df['火灾损失'].values.reshape(-1, 1)

 将导入的数据都转为列向量,使用reshape()方法        

# 创建线性回归模型实例
model = LinearRegression()
# 训练模型
model.fit(x, y)
a = model.coef_[0]
b = model.intercept_
print(a,b)

 运行结果coef为系数,intercept为截距

r_squared = model.score(x, y)
#返回决定系数
print(f"R²: {r_squared}")

score()方法获取模型的决定系数,随后直接输出即可

运行结果为:

# 添加常数项以拟合截距
x = sm.add_constant(x)
# 创建模型并拟合数据
model = sm.OLS(y, x).fit()
# 查看回归结果摘要
print(model.summary())

先通过 sm.add_constant() 向矩阵 X 添加截距列后,再用 sm.OLS() 建立普通最小二乘模型,最后用 model.fit() 就能实现线性回归模型的拟合,并返回拟合与统计分析的结果摘要。

运行结果如下:

  • 13
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值