K近邻算法调用参数:
weights:决策规则
样本权重,可选参数:uniform(等权重)、distance(权重和距离成反比,越近影响越强);默认为uniform
n_neighbors(相当于K的选择):
邻近数目,默认为5
algorithm(实现方法):
计算方式,默认为auto(自动选择,会选择到适合的方法),可选参数:auto、ball_tree、kd_tree、brute(蛮力法);推荐选择kd_tree
leaf_size(叶节点数量):
在使用KD_Tree的时候,叶子数量,默认为30
metric(距离度量的方式):
样本之间距离度量公式,默认为minkowski(闵可夫斯基);当参数p为2的时候,其实就是欧几里得距离
p:
给定minkowski距离中的p值,默认为2
基于鸢尾花数据进行模型构建,使用KNN算法进行构建
1、分类类型处理
import numpy as np
import pandas as pd
from sklearn.preprocessing import StandardScaler, LabelEncoder
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.neighbors import KNeighborsClas