8、K近邻算法实战

最新推荐文章于 2022-05-09 10:41:51 发布

T o r

最新推荐文章于 2022-05-09 10:41:51 发布

阅读量275

点赞数

分类专栏：数据分析实战篇文章标签：算法 python 机器学习深度学习人工智能

本文链接：https://blog.csdn.net/qwe863226687/article/details/115652043

版权

本文详细介绍了K近邻算法的参数设置，包括weights、n_neighbors、algorithm、leaf_size、metric和p等。通过鸢尾花数据集，分别展示了在分类和回归问题中的应用。在分类处理中强调了特征缩放和K值选择的重要性，采用网格搜索交叉验证。回归处理中则进行了标准化操作，并使用不同的评估指标进行模型效果评估。

摘要由CSDN通过智能技术生成

K近邻算法调用参数：

weights：决策规则

样本权重，可选参数:uniform(等权重)、distance(权重和距离成反比，越近影响越强);默认为uniform

n_neighbors（相当于K的选择）：

邻近数目，默认为5

algorithm（实现方法）：

计算方式，默认为auto（自动选择，会选择到适合的方法），可选参数:auto、ball_tree、kd_tree、brute（蛮力法）;推荐选择kd_tree

leaf_size（叶节点数量）：

在使用KD_Tree的时候,叶子数量，默认为30

metric（距离度量的方式）：

样本之间距离度量公式，默认为minkowski（闵可夫斯基);当参数p为2的时候，其实就是欧几里得距离

p：

给定minkowski距离中的p值，默认为2

基于鸢尾花数据进行模型构建，使用KNN算法进行构建

1、分类类型处理

import numpy as np
import pandas as pd
from sklearn.preprocessing import StandardScaler, LabelEncoder
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.neighbors import KNeighborsClas