利用岭回归来预测波士顿房价,浅谈一下对于机器学习的理解
利用sklearn 加载数据集
from sklearn.datasets import load_boston
boston = load_boston()
导入
from sklearn.model_selection import train_test_split
利用 train_test_split 将数据集划分为 训练集和测试集
train_feature, test_feature, train_target, test_target = train_test_split(boston.data, boston.target)
注意train_tets_split传入的参数,是数据集的特征值和目标值
对于接收变量的含义:
train_feature:训练集的特征值
test_feature:测试集的特征值
train_target:训练集的目标值
test_traget:测试集的目标值
导入
from sklearn.preprocessing import StandardScaler
利用StandardScaler 对特征值进行标准化处理
实例化一个转换器
stand = StandardScaler()
对特征值进行转换
train_feature = stand.fit_transform(train_feature)
test_feature = stand.fit_transform(test_feature)
注意:转换器转换的一定是特征值。
导入
from sklearn.linear_model import Ridge # 这里利用的是岭回归进行模型训练
实例化模型
estimator = Ridge()
模型训练
estimator.fit(train_feature, train_target)
注意:模型训练传入参数 一定要是训练集的特征值,和训练集的目标值。
打印预测值
print("预测值是:", estimator.predict(test_feature))
注意:predict传入参数是测试集的的特征值
打印准确率
print("准确率是:", estimator.score(test_feature, test_traget))
注意:score传入参数是测试集的特征值,和测试集的目标值