机器学习——k近邻算法鸢尾花案例

最新推荐文章于 2024-06-22 00:26:05 发布

0x9777

最新推荐文章于 2024-06-22 00:26:05 发布

阅读量503

点赞数 8

文章标签：机器学习

本文链接：https://blog.csdn.net/qq_55407291/article/details/136118668

版权

KNN（K-Nearest Neighbors）算法是一种基于实例的学习算法，它通过测量不同数据点之间的距离进行分类。在KNN算法中，每个数据点都被视为一个样本，并且根据其与相邻样本的距离进行分类。KNN算法的优点是简单易懂，易于实现，不需要训练过程，但需要大量的内存来存储训练数据集。

下面是一个简单的Python代码示例，演示如何使用KNN算法对鸢尾花数据集进行分类，并使用matplotlib库进行数据可视化。

python复制代码

	`import numpy as np`
	`import matplotlib.pyplot as plt`
	`from sklearn import datasets`
	`from sklearn.model_selection import train_test_split`
	`from sklearn.preprocessing import StandardScaler`
	`from sklearn.neighbors import KNeighborsClassifier`

	`# 加载鸢尾花数据集`
	`iris = datasets.load_iris()`
	`X = iris.data`
	`y = iris.target`

	`# 划分训练集和测试集`
	`X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)`

	`# 数据标准化`
	`scaler = StandardScaler()`
	`X_train = scaler.fit_transform(X_train)`
	`X_test = scaler.transform(X_test)`

	`# 使用KNN算法进行训练`
	`knn = KNeighborsClassifier(n_neighbors=3)`
	`knn.fit(X_train, y_train)`

	`# 预测测试集`
	`y_pred = knn.predict(X_test)`

	`# 可视化结果`
	`plt.scatter(X_test[:, 0], X_test[:, 1], c=y_test, cmap='viridis', label='True')`
	`plt.scatter(X_test[:, 0], X_test[:, 1], c=y_pred, cmap='viridis', alpha=0.5, label='Predicted')`
	`plt.xlabel('Sepal Length')`
	`plt.ylabel('Sepal Width')`
	`plt.legend()`
	`plt.show()`

在上面的代码中，我们首先加载了鸢尾花数据集，并将其划分为训练集和测试集。然后，我们使用StandardScaler对数据进行标准化处理，这是因为KNN算法对数据的尺度敏感。接下来，我们创建一个KNN分类器对象，并使用训练数据对其进行训练。最后，我们使用测试数据进行预测，并使用matplotlib库将预测结果可视化。

在可视化结果中，我们使用散点图表示测试数据集中的每个样本点，其中x轴表示萼片长度，y轴表示萼片宽度。对于每个样本点，我们使用不同的颜色表示其真实类别和预测类别。通过比较真实类别和预测类别的颜色，我们可以直观地评估KNN算法的分类效果。

0x9777

关注

8
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
机器学习——k近邻算法鸢尾花案例

然后，我们使用StandardScaler对数据进行标准化处理，这是因为KNN算法对数据的尺度敏感。在KNN算法中，每个数据点都被视为一个样本，并且根据其与相邻样本的距离进行分类。KNN算法的优点是简单易懂，易于实现，不需要训练过程，但需要大量的内存来存储训练数据集。在可视化结果中，我们使用散点图表示测试数据集中的每个样本点，其中x轴表示萼片长度，y轴表示萼片宽度。下面是一个简单的Python代码示例，演示如何使用KNN算法对鸢尾花数据集进行分类，并使用matplotlib库进行数据可视化。
复制链接

扫一扫