KNN参数设置小实验——基于mglearn人工生成数据集(结果可视化)

KNN的小实验

part 1 K值与模型复杂度关系

采用mglearn包中的make_forge来训练~

不同K值下模型的决策边界平滑度

实验数据集

make_forge数据集

turple类型,是一个二分的数据集,藏着两个array
一个array是(26,2)的X
一个array是(26,1)的y

mglearn可通过加载datasets获取人工生成的数据,也就是前缀带make的,而本文的make_forge就是人工生成的,用于学习KNN的~

我们先导入基本的包!

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import mglearn

import warnings
warnings.filterwarnings('ignore')

#观察数据
X,y = mglearn.datasets.make_forge()
mglearn.discrete_scatter(X[:,0],X[:,1],y) # 作X,y的散点分布图
plt.legend(['Class 0','Class 1'],loc = 4)
plt.xlabel("First feature")
plt.ylabel("Second feature")
print("X.shape: {}".format(X.shape))

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
对于鸢尾花数据集可视化,可以使用K最近邻(K-Nearest Neighbors,简称KNN)算法来实现。KNN是一种简单而常用的分类算法,它通过测量不同特征之间的距离来判断未知样本属于哪个类别。 首先,我们需要导入所需的库: ```python import pandas as pd import seaborn as sns import matplotlib.pyplot as plt from sklearn.datasets import load_iris from sklearn.neighbors import KNeighborsClassifier ``` 然后,加载鸢尾花数据集: ```python iris = load_iris() df = pd.DataFrame(data=iris.data, columns=iris.feature_names) df['target'] = iris.target ``` 可以使用seaborn的pairplot函数来绘制特征之间的散点图: ```python sns.pairplot(df, hue='target') plt.show() ``` 接下来,我们可以使用KNN算法来对鸢尾花数据集进行分类,并将分类结果可视化: ```python knn = KNeighborsClassifier(n_neighbors=3) knn.fit(iris.data, iris.target) # 生成网格点 x_min, x_max = iris.data[:, 0].min() - 1, iris.data[:, 0].max() + 1 y_min, y_max = iris.data[:, 1].min() - 1, iris.data[:, 1].max() + 1 xx, yy = np.meshgrid(np.arange(x_min, x_max, 0.1), np.arange(y_min, y_max, 0.1)) # 预测网格点的类别 Z = knn.predict(np.c_[xx.ravel(), yy.ravel()]) Z = Z.reshape(xx.shape) # 绘制分类边界和样本点 plt.figure(figsize=(10, 8)) plt.contourf(xx, yy, Z, alpha=0.8) sns.scatterplot(x=df.iloc[:, 0], y=df.iloc[:, 1], hue=df['target'], palette='Set1') plt.xlabel('sepal length (cm)') plt.ylabel('sepal width (cm)') plt.title('KNN Classification') plt.show() ``` 这样就可以得到鸢尾花数据集经过KNN算法分类后的可视化结果。在这个图中,不同颜色的点表示不同类别的鸢尾花样本,背景色表示KNN分类边界。 注意,这里只选择了两个特征(sepal length和sepal width)进行可视化,你可以根据需要选择其他特征来进行可视化

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值