【4】KNN算法

最新推荐文章于 2024-08-12 19:10:16 发布

星空锚点

最新推荐文章于 2024-08-12 19:10:16 发布

阅读量69

点赞数

文章标签：机器学习 python 人工智能

本文链接：https://blog.csdn.net/m0_68100317/article/details/130290851

版权

文章介绍了KNN算法的基本原理，包括欧氏距离和曼哈顿距离两种距离计算方法。在实际应用中，以鸢尾花数据集为例，展示了如何使用Python的sklearn库进行数据预处理（标准化）和模型训练。通过设置k值为3，训练并评估了KNN模型，最终输出了模型在测试集上的准确率。

摘要由CSDN通过智能技术生成

KNN算法

某一未知样本的类别是在特征空间里距离它最近的k个样本中，居于大多数的类别
计算两个样本 $A(a_1, a_2, a_3)$ , $B(b_1, b_2, b_3)$ 之间的距离，距离计算公式有多种，这里举出常用的两种：

欧氏距离： $d_{AB}=\sqrt{(a_1-b_1)^2+(a_2- b_2)^2+(a_3-b_3)^2}$
曼哈顿距离： $d_{AB}=|a_1-b_1|+|a_2-b_2|+|a_3-b_3|$

$k$ 值若太小，容易受到异常值的影响
$k$ 值若太大，容易受到样本数量分布的影响

在鸢尾花数据集上使用KNN算法

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.preprocessing import StandardScaler


# 获取数据
iris = load_iris()

# 划分数据集
x_train, x_test, y_train, y_test = train_test_split(iris.data, iris.target, random_state=22)

# 标准化
transfer = StandardScaler()
x_train = transfer.fit_transform(x_train)
# 使用训练集的标准差和平均值，因此这里用的是transform而不是fit_transform
x_test = transfer.transform(x_test)

# KNN调用
estimator = KNeighborsClassifier(n_neighbors=3)
estimator.fit(x_train, y_train)

# 模型评估
score = estimator.score(x_test, y_test)
print(score)

输出最后的准确率
在这里插入图片描述

星空锚点

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
【4】KNN算法

某一未知样本的类别是在特征空间里中，居于的类别计算两个样本Aa1a2a3Bb1b2b3dABa1−b12a2−b22a3−b32dAB∣a1−b1∣∣a2−b2∣∣a3−b3∣k值若太小，容易受到异常值的影响k值若太大，容易受到样本数量分布的影响。
复制链接

扫一扫