今天给大家讲解下如何用SVM进行房价预测(回归预测)和鸢尾花分类预测。
整个程序大概分以下几个步骤:
1.载入数据:(这里我们载入sklearn自带的数据集,load_boston波士顿房价数据)
#1.导入数据集
from sklearn.datasets import load_boston
boston = load_boston()
# print(boston)
# print(boston.DESCR)
# print(boston.feature_names)
# print(boston.data)
# print(boston.target)
x = boston.data
y = boston.target
x就是我们要给机器进行学习的特征,如房间大小,位置,房间数等等,
y就是我们要得到的预测结果(房价)
2.将数据分割成训练集和测试集:为什么要这么做呢?从字面上看,我们其实可以理解,训练集,就是我们要给机器进行训练学习的数据。测试集是当机器进行训练学习完毕后,我们对训练结果的一个检验。
#2.将数据分割成训练集和测试集
from sklearn.model_selection import train_test_split
#随机采样33%作为测试 67%作为训练
train_x, test_x, train_y, test_y = train_test_split(x, y, test_size=0.33, random_state=43)
# print(train_x.shape) #训练集输入特征
# print(test_x.shape) #测试集输入特征
# print(train_y.shape) #训练集的目标值(房价)
# print(test_y.shape)