Python多元线性回归

5 篇文章 0 订阅

Python多元线性回归

1.首先导入需要的模块

import pandas
from sklearn.model_selection import train_test_split #交叉验证 训练和测试集合的分割
from sklearn.linear_model import LinearRegression
import numpy as np
import matplotlib.pyplot as plt

2.数据集使用的是Advertising.csv;总共两百条数据,记录的是广告投入与销售之间的关系。之间关系如下
Sales = TVx1+Radiox2+Newspaper*x3+b;
在这里插入图片描述
3.读取数据

# 读取csv数据
data = pandas.read_csv("csv//Advertising.csv");

4.构建X和Y特征向量

# 构建X和Y   scikit-learn要求X是一个特征矩阵,y是一个NumPy向量。pandas构建在NumPy之上。
# 因此,X可以是pandas的DataFrame,y可以是pandas的Series,scikit-learn可以理解这种结构
X = data[['TV','Radio','Newspaper']];  #返回 dataframe
print(type(X),"  ",X.shape);   # 返回X类型  X的维度
Y = data['Sales']; #返回Series类型  及list
print(type(Y),"   ",Y.shape);  # 返回X类型  X的维度

输出
在这里插入图片描述
5.拆分训练集和测试集

#  训练集测试集拆开 百分之75用于训练 百分之25用于测试
# random_state 在需要设置random_state的地方给其赋一个值,当多次运行此段代码能够得到完全一样的结果,别人运行此代码也可以复现你的过程。若不设置此参数则会随机选择一个种子,执行结果也会因此而不同了。虽然可以对random_state进行调参,但是调参后在训练集上表现好的模型未必在陌生训练集上表现好,所以一般会随便选取一个random_state的值作为参数。
X_train,X_test,Y_train,Y_test = train_test_split(X,Y,random_state=1);
print(X_train.shape,"  ",X_test.shape,"  ",Y_train.shape,"  ",Y_test.shape);

输出
在这里插入图片描述
6.线性回归

# sklearn线性回归
lrg = LinearRegression();
model = lrg.fit(X_train,Y_train);  #训练
print(model);
print(lrg.intercept_);  #输出截距
coef = zip(['TV','Radio','Newspaper'],lrg.coef_) #特征和系数对应  打包对应为元组
for T in coef :
    print(T); #输出系数

输出
在这里插入图片描述
7.预测

#预测
y_pred = lrg.predict(X_test);
print(y_pred);  #输出测试值

输出
在这里插入图片描述
8.#评价测度

#评价测度  对于分类问题,评价测度是准确率,但其不适用于回归问题,因此使用针对连续数值的评价测度(evaluation metrics)。
# 这里介绍3种常用的针对线性回归的评价测度。·
# 平均绝对误差(Mean Absolute Error,MAE);
# ·均方误差(Mean Squared Error,MSE);
# ·均方根误差(Root Mean Squared Error,RMSE)。这里使用RMES进行评价测度。
print("预测");
print(type(y_pred),type(Y_test));
print(len(y_pred),len(Y_test));  #  len() 方法返回对象(字符、列表、元组等)长度或项目个数。

sum_mean = 0;
for i in range(len(y_pred)):   #for循环
    sum_mean+=(y_pred[i]-Y_test.values[i])**2;
sum_erro = np.sqrt(sum_mean/len(y_pred));  # sqrt()根号  均方根误差
print("均方根误差",sum_erro);

输出
在这里插入图片描述
9.绘制ROC曲线

plt.figure();
plt.plot(range(len(y_pred)),y_pred,'b',label="predict");   #x: x轴上的数值 y: y轴上的数值 ls:折线图的线条风格 lw:折线图的线条宽度 label:标记图内容的标签文本
plt.plot(range(len(Y_test)),Y_test,'r',label="test");
plt.xlabel("the number of sales");
plt.ylabel("value of sales");
plt.legend();  # 用于显示plot函数里面 label标签
plt.show();

输出
在这里插入图片描述

  • 11
    点赞
  • 83
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 6
    评论
Python中进行多元线性回归分析,可以使用statsmodels库或sklearn库。使用statsmodels库可以进行统计分析,并得到显著性检验和拟合优度检验的结果。使用sklearn库可以进行机器学习模型的建立和预测。 在使用statsmodels库进行多元线性回归分析时,可以按照以下步骤进行操作: 1. 导入所需的库,包括pandas、statsmodels.api等。 2. 准备数据集,包括因变量y和自变量x1、x2、x3。 3. 构建多元线性回归模型,使用ols函数进行建模,并使用fit函数进行拟合,得到模型对象。 4. 使用summary函数查看模型的详细结果,包括参数估计值、显著性检验等。 5. 进行变量共线性检验,可以使用vif函数计算VIF值,判断自变量之间的共线性情况。 示例代码如下: ``` import pandas as pd import statsmodels.api as sm # 导入数据集 data = pd.read_csv("data.csv") # 构建多元线性回归模型 model = sm.ols('y ~ x1 + x2 + x3', data=data).fit() # 查看模型结果 print(model.summary()) # 进行变量共线性检验 def vif(df, col_i): cols = list(df.columns) cols.remove(col_i) cols_noti = cols formula = col_i + ' ~ ' + ' + '.join(cols_noti) r2 = sm.ols(formula, df).fit().rsquared return 1. / (1. - r2) vif_score = vif(data, 'x1') print("VIF score for x1:", vif_score) ``` 另外,在sklearn库中进行多元线性回归分析时,可以使用LinearRegression类进行建模和预测。示例代码如下: ``` import pandas as pd from sklearn.linear_model import LinearRegression # 导入数据集 data = pd.read_csv("data.csv") # 准备自变量和因变量 X = data[['x1', 'x2', 'x3']] y = data['y'] # 构建多元线性回归模型 model = LinearRegression() model.fit(X, y) # 查看模型系数 print("Coefficients:", model.coef_) print("Intercept:", model.intercept_) # 进行预测 y_pred = model.predict(X) ``` 综上所述,以上是在Python中进行多元线性回归分析的基本步骤和示例代码。具体的操作根据实际情况和数据集的特点进行调整。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [Python实现多元线性回归](https://blog.csdn.net/weixin_44255182/article/details/108687764)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* [python:多元线性回归总结](https://blog.csdn.net/qq_42862437/article/details/124454098)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

pumpkin的玄学

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值