定义:利用回归方程(函数)对一个或多个自变量(特征值)和因变量(目标值)之前关系进行建模的一种分析方式。 特点:只有一个自变量的情况称为:单变量回归;多余一个自变量的情况称为:多元回归。 原理:每条数据有n个特征,每个特征对应着自己的权重值,与权重的乘积再加上一个偏置值,这个就是线性回归模型。
'''
逻辑步骤:
1、获取数据集
2、数据基本处理
3、特征工程
4、机器学习
5、模型评估
'''
from sklearn.linear_model import LinearRegression
# 构造数据集
x = [[80, 86],
[82, 80],
[85, 78],
[90, 90],
[86, 82],
[82, 90],
[78, 80],
[92, 94]]
y = [84.2, 80.6, 80.1, 90, 83.2, 87.6, 79.4, 93.4]
# 实例化API
obj = LinearRegression()
obj.fit(x, y)
# 获取回归系数和偏移量
obj.coef_ # 回归系数
obj.intercept_ # 偏移量
# 预测
predict = obj.predict([[100, 80]])
print(predict)