sklearn标准线性回归模型
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
from sklearn.model_selection import train_test_split #模型评估 留出法(最基础的3、7分类的评估形式,这里导入的是模型评估模块)
from sklearn.linear_model import LinearRegression#线性回归
from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score
#度量导包(训练完之后一定要用的度量工具) mse mae r2(mse是均方值误差,mae是绝对值误差,还有R2的0到1区间误差)
进行pandas的读入
path = r’路径’
data = pd.read_csv(path) # 4列数据
x = data[[‘TV’, ‘Radio’, ‘Newspaper’]]#将电视广告,广播广告,报纸广告作为特征
y = data[‘Sales’]#销售额作为标签
print(x)
print(y)
发掘各种广告投入对销售额的影响哪个是最大的
绘制样本分布,观察效果(其实报纸不适合用作考虑特征,报纸的数据模型呈现的是和销售额不成正比,图像非常的散乱)
plt.plot(data[‘TV’], y, ‘ro’, label=‘TV’)
plt.plot(data[‘Ra