机器学习实战(用Scikit-learn和TensorFlow进行机器学习)(三)

本文链接：https://blog.csdn.net/fjl_csdn/article/details/79019437

上一节讲述了真实数据（csv表格数据）训练集的查看与预处理以及Pineline的基本架构。今天接着往下进行实战操作，会用到之前的数据和代码，如果有问题请查看上一节。

三、开始实战

7、选择及训练模型

首先尝试训练一个线性回归模型（LinearRegression）

from sklearn.linear_model import LinearRegression
lin_reg = LinearRegression()
lin_reg.fit(train_housing_prepared, train_housing_labels)

训练完成，然后评估模型，计算训练集中的均方根误差（RMSE）

from sklearn.metrics import mean_squared_error
housing_predictions = lin_reg.predict(train_housing_prepared)
lin_mse = mean_squared_error(train_housing_labels, housing_predictions)
lin_rmse = np.sqrt(lin_mse)
lin_rmse

这里写图片描述

可以看到线性回归模型的训练集均方误差为68626

再试试看更强大的模型，决策树模型（DecisionTreeRegressor）

from sklearn.tree import DecisionTreeRegressor
tree_reg = DecisionTreeRegressor()
tree_reg.fit(train_housing_prepared, train_housing_labels)
housing_predictions = tree_reg.predict(train_housing_prepared)
tree_mse = mean_squared_error(train_housing_labels, housing_predictions)
tree_rmse = np.sqrt(tree_mse)
tree_rmse

这里写图片描述