写在前面的话:这一段时间都是在学习sklearn库的学习,当通过这一段时间的了解各个模型的精确度想要进行比较 一下,所以想着自己把同一类的算法封装的一块以后直接调用接口,当然在这个封装过程中只是单纯的库函数实现的模型,对于调整参数没有过多设
- 首先我们这次选取的就j就是datasets 库里面波士顿房价问题
- 在这个问题之前我们先来介绍一下各个模型的适配对象,最先想到的就是三个线性回归模型
lassso 和Ridge 以及线性lineaRegression 之间不同的区别一个针对高纬度数据的回归。优点包括:
最小角回归1. 当维度远远大于数据点的个数时,非常有效。
Ridge拥有向前选择法的速度,同时具有普通最小二乘法的复杂度。
LineaRegression更符合人的直觉,比如两个相似的数据会有两个相似的结果。
缺点:因为他是基于迭代的,所以对噪声特别敏感。
import pandas as pd
import matplotlib.pyplot as plt
from sklearn import model_selection
from sklearn import datasets
# from sklearn.neighbors import KNeighborsClassifier
data=datasets.load_boston()
print(data.data.shape)
print(data.target.shape)
boston_x=data.data
boston_y=data['target']
from sklearn import model_selection
from sklearn import preprocessing
from sklearn.pipeline import Pipeline#多项式回归
#导入弹性