python多元线性回归mlr 校正_多元线性回归的机器学习

本文介绍了如何使用Python进行多元线性回归分析,包括模型的假设、方程及其实现步骤。通过50家初创公司的数据集,展示了如何处理分类变量、训练测试集划分以及模型评估,最终得到训练准确率95%、测试准确率93%的模型。
摘要由CSDN通过智能技术生成

在前面的主题中,我们学习了简单线性回归,即使用单个独立的/预测器(X)变量对响应变量(Y)进行建模,但是在不同的情况下响应变量可能受到多个预测器变量的影响;对于这种情况,我们使用了多元线性回归算法。

多元线性回归是简单线性回归的扩展,需要多个预测变量来预测响应变量。我们可以把它定义为:

多元线性回归是建立单因变量与多自变量线性关系模型的重要回归算法之一。

例:

根据汽车的发动机尺寸和气缸数预测二氧化碳排放量。

关于MLR一些要点:

对于MLR,因变量或目标变量(Y)必须是连续/实数,而预测变量或自变量可以是连续或分类形式。

每个特征变量必须与因变量建立线性关系的模型。

MLR试图通过多维数据点空间拟合回归线。

MLR方程:

在多元线性回归中,目标变量(Y)是多个预测变量x1、x2、x3、…、xn的线性组合。由于它是对简单线性回归的一种增强,所以对多元线性回归方程同样适用,则方程为:

Y= b0+b1x1+ b2x2+ b3x3+...... bnxn ............... (a)

其中,

Y =输出/响应变量

B0,B1,B2,B3,… BN =模型的系数。

X1,X2,X3,X4,… =各种独立/特征变量

对于多元线性回归的假设:

目标变量和预测变量之间应该存在线性关系。

回归残差必须服从正态分布。

MLR假设数据很少或没有多重共线性(自变量之间的相关性)。

使用Python实现多元线性回归模型

要使用Python MLR实现,我们有以下的问题:

问题描述:

我们有50家初创公司的数据集。该数据集包含五个主要信息:一个财政年度的研发支出、管理支出、营销支出、状态和利润。我们的目标是建立一个模型,可以很容易地确定哪家公司的利润最大,哪家公司的利润影响最大。

因为我们需要计算利润,所以它是因变量,其他四个变量是自变量。下面是部署MLR模型的主要步骤:

数据预处理步骤

将MLR模型拟合到训练集

预测测试集的结果

步骤-1:数据预处理步骤:

第一步是数据预处理,我们已经在本教程中讨论过了。此过程包含以下步骤:

导入库:首先,我们将导入有助于构建模型的库。以下是它的代码::

# importing libraries

import numpy as nm

import matplotlib.pyplot as mtp

import pandas as pd

导入数据集:现在,我们将导入数据集(50_CompList),它包含了所有的变量。下面是它的代码:

#importing datasets

data_set= pd.read_csv('50_CompList.csv')

输出:我们将得到的数据集为:

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值