机器学习经典算法之一：KNN

Florayyli

已于 2022-03-09 23:45:27 修改

阅读量1.3k

点赞数 1

分类专栏：机器学习十大经典算法文章标签：机器学习算法 sklearn

于 2022-03-09 21:51:03 首次发布

本文链接：https://blog.csdn.net/L________YY/article/details/123388140

版权

机器学习十大经典算法专栏收录该内容

2 篇文章 0 订阅

订阅专栏

机器学习经典算法之一：KNN

什么是KNN算法

什么是KNN算法

KNN算法，即K邻近算法，根据已知的数据样本排序，取得最靠近待预测样本的前K个已知数据样本的目标值，作为待预测样本的目标值，是一种监督式的学习方式。
（大白话：根据邻居来推断类别）

实例：用KNN实现鸢尾花分类

案例说明：
数据集为Iris鸢尾花图片数据集，本算法通过KNN（K邻近算法）对鸢尾花进行分类，并计算最终的准确率。

# 数据集
from sklearn.datasets import load_iris
# 划分测试训练
from sklearn.model_selection import train_test_split
# 标准化
from sklearn.preprocessing import StandardScaler
# 分类器
from sklearn.neighbors import KNeighborsClassifier

def dnn_iris():
    '''用KNN算法对鸢尾花分类'''
    # 1 获取数据
    iris = load_iris()
    # 2 划分数据集
    x_train,x_test,y_train,y_test = train_test_split(iris.data, iris.target, random_state=6)# 随机数种子
    # 3 特征工程标准化(x-u/σ)区别归一化（x-min/max-min）
    transfer = StandardScaler()
    x_train = transfer.fit_transform(x_train)
    # 沿用上述的fit标准差
    x_test = transfer.transform(x_test)
    # 4 KNN算法预估器
    estimator = KNeighborsClassifier(n_neighbors=3)
    estimator.fit(x_train,y_train)
    # 5 模型评估 准确率
    score = estimator.score(x_test,y_test)
    print(score)
    return None

if __name__ == '__main__':
    print('KNN算法进行鸢尾花分类')
    dnn_iris()