费尔南多选择了最好的模型。他建立了多元回归模型。该模型具有以下形状:
价格= -55089.98 + 87.34X发动机尺寸+ 60.93X马力+ 770.42X宽度
该模型根据发动机尺寸,马力和宽度(预测变量)预测或估算价格(目标)。该模型将所有预测变量都作为数值。
如果有定性变量怎么办?定性变量如何用于增强模型?定性变量如何解释?
费尔南多得到两个这样的定性变量:
- fuelType:使用的燃料类型。该值可以是汽油或柴油。
- driveWheels:驱动轮的类型。它具有三个值4轮驱动(4WD),后轮驱动(RWD)和前轮驱动(FWD)。
数据集如下所示。
![2c3ee84167960a972d086b05111083cb.png](https://i-blog.csdnimg.cn/blog_migrate/baaaa26cd747b74aa56623eb9e66ba7b.jpeg)
费尔南多希望找出这些定性变量对汽车价格的影响。
概念
定性变量是非数字变量。它将数据分类。它们也称为分类变量或因素。
因素有级别。级别不过是特定定性变量的唯一值。
- 燃料类型具有两个唯一值。汽油或柴油。这意味着燃料类型有两个因素。
- 驱动轮具有三个独特的价值。四轮驱动,后轮驱动和前轮驱动。