Python学习-KNN预测加尼福尼亚房价

本文介绍了使用Python的KNN算法预测加利福尼亚房价的过程。首先,介绍了所需的Python库,接着详细说明了如何利用train_test_split函数划分训练集和测试集。KNN算法通过寻找最近邻并根据目标标号的多数票进行分类。由于KNN基于欧式距离,故在预测前需对数据进行标准化以消除特征数值差异的影响。经过标准化后,模型的平均绝对误差(MAE)降低到0.39,显著优于未标准化的1.14,证明标准化的有效性。
摘要由CSDN通过智能技术生成

加尼福尼亚房价数据集与KNN

需要的几个Python库

import matplotlib.pyplot as plt  
from sklearn import datasets
from sklearn.neighbors import KNeighborsRegressor
from sklearn.cross_validation import train_test_split
from sklearn.metrics import mean_squared_error
import numpy as np  

数据集内容:

这里data为数据集,target为目标,DESCR为简单的介绍,feature_names为列名。

利用train_test_split函数对训练和测试集进行划分

cali=datasets.california_housing.fetch_california_housing()
x=cali['data']
y=cali['target']
#x=pd.DataFrame(x)
#x.columns=cali['feature_names']
x_train,x_test,y_train,y_test=train_test_split(x,y,train_size=0.8)

这里是sklearn-train_test_split随机划分的介绍:

传送门: https://blo

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值