数据(前4行)是这样的:
R&D Spend | Administration | Marketing Spend | State | Profit |
165349.2 | 136897.8 | 471784.1 | New York | 192261.8 |
162597.7 | 151377.6 | 443898.5 | California | 191792.1 |
153441.5 | 101145.6 | 407934.5 | Florida | 191050.4 |
144372.4 | 118671.9 | 383199.6 | New York | 182902 |
前4列是特征(不只一个特征,多元),最后一列是输出。
第1步:数据预处理
导入库、数据集
类别数据数字化
躲避虚拟变量陷阱,类别变量减一
第2步:在训练集上训练多元线性回归模型
与上一节简单线性回归相同
第3步:预测结果
与上一节简单线性回归相同