波士顿房价数据集(Boston House Price Dataset)包含对房价的预测,以千美元计,给定的条件是 房屋及其相邻房屋的详细信息。
该数据集是一个回归问题。每个类的观察值数量是均等的,共有 506 个观察,13 个输入变量和1个输 出变量。
下载网址:https://pan.baidu.com/s/16ekJ7Lzrm-dH1ObNgeRNmA
密码:kcar
下载下来的数据集分为x.npy和y.npy,共506条数据。
使用SVR支持向量回归和Ridge岭回归实现回归预测。
Python代码
import numpy as np
import pandas as pd
from sklearn.svm import SVR
X = np.load('x.npy')
y = np.load('y.npy')
train_X = X[:406]
train_y = y[:406]
test_X = X[406:]
test_y = y[406:]
svr_linear = SVR(kernel='linear')
svr_rbf = SVR(kernel='rbf')
svr_linear.fit(train_X,train_y)
svr_rbf.fit(train_X,train_y)
linear_y_pre = svr_linear.predict(test_X)
rbf_y_pre = svr_rbf.predict(test_X)
linear_y_pre=pd.DataFrame(data=linear_y_pre)
linear_y_pre.to_csv('y_linear.csv',encoding='utf-8')
rbf_y_pre=pd.DataFrame(data=rbf_y_pre)
rbf_y_pre.to_csv('y_rbf.csv',encoding='utf-8')
from sklearn.linear_model import Ridge
ridge = Ridge(alpha=.5)
model = ridge.fit(train_X,train_y)
y_predict = model.predict(test_X)
y_predict=pd.DataFrame(data=y_predict)
y_predict.to_csv('y_ridge.csv',encoding='utf-8')