一、回归预测
在前面的文章中我们介绍了机器学习主要解决分类、回归和聚类三大问题。今天我们来具体了解一下使用机器学习算法进行回归预测。
回归预测主要用于预测与对象关联的连续值属性,得到数值型的预测数据。回归预测的应用场景有各类的价格预测、相关性的反应预测等。
下面,我们就使用sklearn模块,以一个sklearn中集成的波士顿房价数据集来演示如何进行回归预测。
二、波士顿房价预测
1、引入数据集
在sklearn中内置的数据集都位于datasets子模块下,我们可以直接进行导入:
导入之后,看看数据集中的内容:
其中有五个键,从字面意思上理解,可以发现data是数据集中所有的数据特征,DESCR是数据集的描述信息,target是数据集特征对应的目标值,feature_name则是数据特征的名称。
我们先来看看数据特征的名称:
可以发现数据集中有13个特征,每个特征具体是什么意思,倒不清楚,我们可以在DESC