Sklearn的KNN
很早以前就写过SK的KNN但一直没写过博客,一直偷懒,最近良心发现!ps:找工作,没的博客拿不出手啊哈哈,于是开始
来把以前的学习的知识一起share
#sklearn.datasets 里面调入波士顿房价的数据
from sklearn.datasets import load_boston
boston=load_boston()
# sklearn.cross_validation 导入数据分割器
from sklearn.cross_validation import train_test_split
import numpy as np
X=boston.data
y=boston.target
直接点,从sk里面拿到一个数据集,可能输出有点慢不要急来下一步
1.标准化数据,保证你的数据波动范围,确保预测性
from sklearn.neighbors import KNeighborsRegressor #从sklearn.
from sklearn.preprocessing import StandardScaler #标准化处理
#StandardScaler 去均值和方差
X_scaler=StandardScaler()
X=X_scaler.fit_transform(X)
y=np.array(y).reshape(-1,1)
y_scaler=StandardScaler()
y=y_scaler.fit_transform(y)
#采用随机采样的方法
X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.25,random_state=33)
#初始化k近邻回归器,并且调整配置,使得预测方式为平均回归 weights='uniform'
uni_knr = KNeighborsRegressor(weights='uniform')
uni_knr.fit(X_train,y_train)
uni_knr_y_predict=uni_knr.predict(X_test)
#初始化k近邻回归器,并且调整配置,使得预测的方式根据距离加权回归
dis_knr=KNeighborsRegressor(weights='distance')
dis_knr.fit(X_train,y_train)
dis_knr_y_predict=dis_knr.predict(X_test)
这里2种方式都要进行,确保来将这个weights这个变量进行对比
from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error
print('weights取值为uniform时的评分:')
#使用 R-squared MSE MAE 三种指标对平均回归配置的K近邻模型在测试集上进行性能评估
print('R-squared 评分',uni_knr.score(X_test,y_test))
print(r2_score(y_test,uni_knr_y_predict)) #顺序不能变
#y_scaler.inverse_transform(y_test) 还原标准结果
#y_scaler.inverse_transform(uni_knr_y_predict) 还原预测结果
#下面的只有打分
print('The mean squared error 评分:',
mean_squared_error(y_scaler.inverse_transform(uni_knr_y_predict) ,y_scaler.inverse_transform(y_test)) )
print('The mean abs error 评分:',
mean_absolute_error(y_scaler.inverse_transform(y_test),y_scaler.inverse_transform(uni_knr_y_predict) ) )
直接来对比,你可以知道那个更适合你这个模型
#使用 R-squared MSE MAE 三种指标对根据距离加权回归配置的K近邻模型在测试上集上进行性能评估
print('weights 取值为 distance 时评分')
print('R-squared value:',
dis_knr.score(X_test,y_test))
print(r2_score(y_test,uni_knr_y_predict))
print('MSE 评分:',
mean_squared_error(y_scaler.inverse_transform(uni_knr_y_predict) ,y_scaler.inverse_transform(y_test)))
print('MAE 评分:',
mean_absolute_error(y_scaler.inverse_transform(y_test),y_scaler.inverse_transform(uni_knr_y_predict) ) )
别说我藏私!!
mean_absolute_error:平均绝对误差 MAE=sum(x-y)/n
mean_squared_error : 均方误差 MSE=sum( (x-y)^2 )/n
R-squared :1-((正确值-预测值)**2).sum/((正确值-预测值)**2).sum()
PS:有什么问题可以私聊我,假如five的我看到的话一定会回复你们的,假如出错务必指出,速度改正