回归分析是确定变量间依赖关系的一种统计分析方法,属于监督学习方法。由变量的不同可以分为一元线性回归和多元线性回归
接下来以多元线性回归为例介绍
当待确定的变量超过一个时,就需要使用多元线性回归算法,下面介绍多变量问题中的多元线性回归分析
数据如下 总共有14个变量 我们需要挨个分析其中一个变量与其他十三个变量之间的依赖关系
程序输出结果如下
其中括号里是其他十三个变量与预测变量这件的关系因子 下面的是截距
下面的是一些参数和误差因子
代码如下 只需根据自己的模型替换数据及预测变量即可
import pandas as pd
from sklearn.linear_model import LinearRegression
from matplotlib import pyplot as plt
import numpy as np
import matplotlib; matplotlib.use('TkAgg')
np.set_printoptions(suppress=True) # 取消科学计数法输出
df = pd.read_csv(r"铅钡未风化数据.csv")
#df1=df['类型']
#print(df1)
#剩下的依次交换预测对象 即可 代码在此不冗余
X = df[[ 'Na2O', 'K2O', 'CaO', 'MgO','Al2O3','Fe2O3','CuO','PbO','BaO','P2O5','SrO','SnO2','SO2']]
Y = df['SiO2']
model = LinearRegression()
model.fit(X, Y)
print("预测结果--------",)
print(model.coef_)
print(model.intercept_)
import statsmodels.api as sm
X2 = sm.add_constant(X)
est = sm.OLS(Y,X2).fit()
print(est.summary())
需要数据集的可以点赞关注收藏后私信博主