一、基础概念
线性回归研究的是一个目标变量和一个自变量之间的回归问题,但有时候在很多实际问题中,影响目标变量的自变量往往不止一个,而是多个,比如绵羊的产毛量这一变量同时受到绵羊体重、胸围、体长等多个变量的影响,因此需要设计一个目标变量与多个自变量间的回归分析,即多元回归分析。由于线性回归并不适用于所有的数据,我们需要建立曲线来适应我们的数据,现实世界中的曲线关系很多都是增加多项式实现的,比如一个二次函数模型:
再或者一个三次函数模型:
这两个模型我们绘制的图形如下所示:
二、Excel多元线性回归
数据分析
- 在Excel打开house_prices.csv文件,在数据选项中打开数据分析,选择其中的回归。
- 在选择其中的area,bathroom,bedroom作为x,可以得出三相数据和price是正相关。而黄线部分得出了对房价的预测。
三、机器学习库Sklearn库多元线性回归
导入包
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn import datasets
from sklearn.linear_model import LinearRegression
from mpl_toolkits.mplot3d import Axes3D # 不要去掉这个import
from sklearn.metrics import mean_squared_error, r2_score
plt.rcParams[&#