Python学习-KNN预测加尼福尼亚房价

最新推荐文章于 2024-07-26 08:00:00 发布

大烟枪yanx

最新推荐文章于 2024-07-26 08:00:00 发布

阅读量2.4k

点赞数 3

本文链接：https://blog.csdn.net/qq_36056559/article/details/80728591

版权

本文介绍了使用Python的KNN算法预测加利福尼亚房价的过程。首先，介绍了所需的Python库，接着详细说明了如何利用train_test_split函数划分训练集和测试集。KNN算法通过寻找最近邻并根据目标标号的多数票进行分类。由于KNN基于欧式距离，故在预测前需对数据进行标准化以消除特征数值差异的影响。经过标准化后，模型的平均绝对误差（MAE）降低到0.39，显著优于未标准化的1.14，证明标准化的有效性。

摘要由CSDN通过智能技术生成

加尼福尼亚房价数据集与KNN

需要的几个Python库

import matplotlib.pyplot as plt  
from sklearn import datasets
from sklearn.neighbors import KNeighborsRegressor
from sklearn.cross_validation import train_test_split
from sklearn.metrics import mean_squared_error
import numpy as np

数据集内容：

这里data为数据集，target为目标，DESCR为简单的介绍，feature_names为列名。

利用train_test_split函数对训练和测试集进行划分

cali=datasets.california_housing.fetch_california_housing()
x=cali['data']
y=cali['target']
#x=pd.DataFrame(x)
#x.columns=cali['feature_names']
x_train,x_test,y_train,y_test=train_test_split(x,y,train_size=0.8)

这里是sklearn-train_test_split随机划分的介绍：

传送门： https://blo