用KNN算法对鸢尾花进行分类,添加网格搜索交叉验证

何为网格搜索:

        网格搜索是一种调参手段,穷举搜索,在所有候选的参数中进行循环遍历,尝试每一种可能性,找到最好的那个参数。

何为交叉验证:

        交叉验证的基本思想是把在某种意义下将原始数据进行分组,一部分做为训练集,另一部分做为验证集,首先用训练集对分类器进行训练,再利用验证集来测试训练得到的模型,以此来做为评价分类器的性能指标。

鸢尾花案例增加k值调优的思路为:

  1. 获取数据
  2. 划分数据集
  3. 标准化
  4. KNN算法预估器(加入网格搜索和交叉验证)
  5. 模型评估

 代码如下:

def knn_iris_gscv():
    #1.获取数据
    iris = load_iris()
    #2.划分数据集
    x_train, x_test, y_train, y_test = 
    train_test_split(iris.data,iris.target,random_state=22)

    #3.特征工程:标准化
    transfer = StandardScaler()
    x_train = transfer.fit_transform(x_train)
    x_test = transfer.transform(x_test)

    #4.KNN算法预估器
    estimator = KNeighborsClassifier(n_neighbors=3)


    #加入网格搜索和交叉验证
    #参数准备
    param_dict = {"n_neighbors":[1,3,5,7,9]}
    estimator = GridSearchCV(estimator,param_grid=param_dict,cv=10)
    estimator.fit(x_train, y_train)

    #5.模型评估
    #方法1 直接比对真实值和预测值
    y_predict = estimator.predict(x_test)
    print("y_predict:\n",y_predict)
    print("直接比对真实值和预测值:\n",y_test==y_predict)
    #方法2 计算准确率
    score = estimator.score(x_test,y_test)
    print("准确率为:\n",score)

    #最佳参数:best_params_
    print("最佳参数:\n",estimator.best_params_)
    #最佳结果:best_score_
    print("最佳结果:\n",estimator.best_score_)
    #最佳估计器:best_estimator
    print("最佳估计器:\n",estimator.best_estimator_)
    #交叉验证结果:cv_results_
    print("交叉验证结果:\n",estimator.cv_results_)
    return None

结果如下:

 

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

lc_MVP

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值