X = dataset.iloc[ : , :-1].values # 取所有行的从一列到最后一列
Y = dataset.iloc[ : , 3].values # 取所有行的第列
OneHotEncoder:直观来说就是有多少个状态就有多少比特,而且只有一个比特为1,其他全为0的一种码制.机器学习中对于离散型的分类型的数据,需要对其进行数字化
单元线性回归用于单变量预测
多元线性回归类似单元线性回归模型,不过不太好画出直观二维图,只能用图展示测试值与预测值之间的误差
day3的多元线性回归可以最后计算下预测的误差,这里计算了均方误差和R2误差
from sklearn.metrics import r2_score
from sklearn.metrics import mean_squared_error
import scipy as sp
print(r2_score(Y_test,y_pred))
print(sp.sqrt(mean_squared_error(Y_test,y_pred)))
0.934706847328
9137.99015279
day4-day6
StandardScaler:特征缩放, (X-mean)/std , 即特征减去均值再除以标准差