一、统计检验
线性回归要做的一系列统计检验:方程的显著性检验(F检验)、变量的显著性检验(t检验)和拟合优度的检验(R、R2)
二、数据类型(源于开放数据集-飞桨AI Studio)
一家中国汽车公司吉利汽车(Geely Auto)希望通过在美国设立生产部门并在当地生产汽车,从而在美国和欧洲同行中竞争来进入美国市场。
他们与汽车咨询公司签约,以了解汽车定价所依赖的因素。具体来说,他们想了解影响美国市场汽车定价的因素,因为这些因素可能与中国市场有很大不同。该公司想知道:
哪些变量对预测汽车价格具有重要意义 这些变量对汽车价格的描述程度如何?
根据各种市场调查,该咨询公司已在整个美国市场上收集了大量不同类型汽车的大数据集。 其中字段包括:
1 | Car_ID | Unique id of each observation (Interger) | ||||
2 | Symboling | Its assigned insurance risk rating, A value of +3 indicates that the auto is risky, -3 that it is probably pretty safe.(Categorical) | ||||
3 | carCompany | Name of car company (Categorical) | ||||
4 | fueltype | Car fuel type i.e gas or diesel (Categorical) | ||||
5 | aspiration | Aspiration used in a car (Categorical) |