KNN的小实验
part 1 K值与模型复杂度关系
采用mglearn包中的make_forge来训练~
不同K值下模型的决策边界平滑度
实验数据集
make_forge数据集
turple类型,是一个二分的数据集,藏着两个array
一个array是(26,2)的X
一个array是(26,1)的y
mglearn可通过加载datasets获取人工生成的数据,也就是前缀带make的,而本文的make_forge就是人工生成的,用于学习KNN的~
我们先导入基本的包!
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import mglearn
import warnings
warnings.filterwarnings('ignore')
#观察数据
X,y = mglearn.datasets.make_forge()
mglearn.discrete_scatter(X[:,0],X[:,1],y) # 作X,y的散点分布图
plt.legend(['Class 0','Class 1'],loc = 4)
plt.xlabel("First feature")
plt.ylabel("Second feature")
print("X.shape: {}".format(X.shape))