k近邻用于回归,先从单一近邻进行分析,使用wave数据集。有3个测试数据点,在x轴上用绿色五角星表示。预测结果用蓝色五角星表示。
import numpy as np
import pandas as pd
import mglearn
import matplotlib.pyplot as plt
mglearn.plots.plot_knn_regression(n_neighbors=1)
输出
当然也可以用多个近邻进行回归,预测结果为这些邻居的平均值
mglearn.plots.plot_knn_regression(n_neighbors=3)
输出
使用scikit-learn中的KNeighborsRegressor来实施k近邻回归,
from sklearn.neighbors import KNeighborsRegressor
from sklearn.model_selection import train_test_split
X,y = mglearn.datasets.make_wave(n_samples=40)
#将数据集划分为训练集和测试集
X_train,<