多元回归预测

多元回归就像线性回归(一个变量预测一个值)一样,但是具有多个独立值,这意味着我们试图基于两个或多个变量来预测一个值。

比如在线性回归中我们可以根据发动机排量的大小预测汽车的二氧化碳排放量,但是通过多元回归,我们可以引入更多变量,例如汽车的重量,以使预测更加准确

在 Python 中,我们拥有可以完成这项工作的模块。首先导入 Pandas 模块

import pandas

Pandas 模块允许我们读取 csv 文件并返回一个 DataFrame 对象。

df = pandas.read_csv("C:\\Users\\ml\\Desktop\\cars.csv")

然后列出独立值,并将这个变量命名为 X。

将相关值放入名为 y 的变量中。

通常,将独立值列表命名为大写 X,将相关值列表命名为小写 y

X = df[['Weight', 'Volume']]

y = df['CO2']

该过程中将使用 sklearn 模块中的一些方法,因此我们也必须导入该模块

`linear_model` 是 Scikit-learn 库中的一个模块,用于实现线性回归模型以及一些相关的模型。在这个模块中,包含了一些常用的线性回归模型,如简单线性回归、多元线性回归、岭回归、Lasso 回归等

from sklearn import linear_model

在 sklearn 模块中,将使用 LinearRegression() 方法创建一个线性回归对象

该对象有一个名为 fit() 的方法,该方法将独立值和从属值作为参数,并用描述这种关系的数据填充回归对象

regr = linear_model.LinearRegression()
regr.fit(X, y)

在,我们有了一个回归对象,可以根据汽车的重量和排量预测 CO2 值:

# 预测重量为 2300kg、排量为 1300ccm 的汽车的二氧化碳排放量

predictedCO2 = regr.predict([[2300, 1300]])

上面完整的代码如下

import pandas
from sklearn import linear_model

df = pandas.read_csv("C:\\Users\\ml\\Desktop\\cars.csv")

X = df[['Weight', 'Volume']]
y = df['CO2']

regr = linear_model.LinearRegression()
regr.fit(X, y)

# 预测重量为 2300kg、排量为 1300ccm 的汽车的二氧化碳排放量:

predictedCO2 = regr.predict([[2300, 1300]])

print(predictedCO2)

经过预测,配备 1.3 升发动机,重量为 2300 千克的汽车,每行驶 1 公里,就会释放约 107 克二氧化碳

系数是描述与未知变量的关系的因子

例如:如果 x 是变量,则 2x 是 x 的两倍。x 是未知变量,数字 2 是系数

在这种情况下,我们可以要求重量相对于 CO2 的系数值,以及体积相对于 CO2 的系数值。我们得到的答案告诉我们,如果我们增加或减少其中一个独立值,将会发生什么

# 打印回归对象的系数值

import pandas
from sklearn import linear_model

df = pandas.read_csv("cars.csv")

X = df[['Weight', 'Volume']]
y = df['CO2']

regr = linear_model.LinearRegression()
regr.fit(X, y)

print(regr.coef_)

 结果数组表示重量和排量的系数值,如果重量增加 1g,则 CO2 排放量将增加 0.00755095g

发动机尺寸(容积)增加 1 ccm,则 CO2 排放量将增加 0.00780526g

提出猜测:如果我们增加 1000g 的重量会怎样?

先进行计算:107.2087328 + (1000 * 0.00755095) = 114.75968

进行验证是否正确?

import pandas
from sklearn import linear_model

df = pandas.read_csv("C:\\Users\\ml\\Desktop\\cars.csv")

X = df[['Weight', 'Volume']]
y = df['CO2']

regr = linear_model.LinearRegression()
regr.fit(X, y)

# 预测重量为 2300kg、排量为 1300ccm 的汽车的二氧化碳排放量:

predictedCO2 = regr.predict([[3300, 1300]])

print(predictedCO2)

由此可见,该系数正确!

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Q渡劫

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值