波士顿房价预测实践(照搬学习)
- 第一步:相关库资源知识
下面展示一些 内联代码片
。
from sklearn.tree import DecisionTreeRegressor
from sklearn.ensemble import AdaBoostRegressor
from sklearn import datasets
from sklearn.metrics import mean_squared_error,explained_variance_score
from sklearn.utils import shuffle
scikit-learn简称sklearn,自2007年发布以来,sklearn已经成为Python重要的机器学习库了,支持包括分类,回归,降维和聚类四大机器学习算法。还包括了特征提取,数据处理和模型评估者三大模块。在这里主要用到四个模块tree:一个分类树模块,这里用到决策树
ensemble:这是一个组合几个模型结果用来增强泛化能力和鲁棒性的模块,主要一个目的是对几个独立模型的结果取均值,起到降低方差的作用。另一个目的是相继建立模型,后者降低前者偏差的作用。在这里,是选用第二个目的,利用AdaBoostRegressor函数。
datasets:sklearn自带的数据集,有这里用到的波士顿房价数据、鸢尾花、手写数字数据
自带数据用法:
sklearn.datasets.load_<name>#自带数据用法,将name改为目标名称
sklearn.datasets.fetch_<name>#在线下载数据集,将name改为目标名称