尽管K近邻算法很容易理解,但由于预测速度慢且缺乏对多特征数据集的处理能力,所以实践中用的比较少。下面我们来介绍一种能够规避这种缺陷的模型:线性模型。
线性模型:线性模型是在实践中广泛应用的一种模型,他是利用输入特征的线性函数进行预测,其一般预测公式为:y = w[0]*x[0] + w[1]*x[1] + ... + w[p]*x[p]
这是高中直线方程的一个扩展应用。下面我们看一下一维wave数据集求w和b的代码:
import mglearn
mglearn.plots.plot_linear_regression_wave()
其运行结果如下:可以看出,一维数据集wave计算出的w[0]=0.393906 , b= -0.031804
![b827e56102bd1d019da307e95640f352.png](https://img-blog.csdnimg.cn/img_convert/b827e56102bd1d019da307e95640f352.png)
线性模型对wave数据集的预测结果
用回归的线性模型可以表示这样的回归模型:对单一特征的预测结果是一条直线,两个特征的测试一个平面。如果使更多特征的则是一个超平面。