用cross_val_score对鸢尾花数据集进行交叉验证

最新推荐文章于 2023-02-24 11:19:25 发布

青木长风

最新推荐文章于 2023-02-24 11:19:25 发布

阅读量1.3k

点赞数 1

分类专栏：数据挖掘

本文链接：https://blog.csdn.net/qq_39936389/article/details/89287463

版权

数据挖掘专栏收录该内容

13 篇文章 0 订阅

订阅专栏

from sklearn import datasets#自带的数据集
from sklearn.model_selection import train_test_split,cross_val_score
from sklearn.neighbors import KNeighborsClassifier
import matplotlib.pyplot as plt
iris=datasets.load_iris()#加载sklearn自带的数据集鸢尾花
X=iris.data#数据
y=iris.target#数据对应的标签
train_X,test_X,train_y,test_y=train_test_split(X,y,test_size=1/3,random_state=3)
k_range=range(1,31)
cv_scores=[]#用来放结果
for n in k_range:
    knn=KNeighborsClassifier(n)#knn模型，这里一个超参数可以做预测，当有多个超参数时应使用另一种方法：GridSearchCV
    scores=cross_val_score(knn,train_X,train_y,cv=10,scoring='accuracy')
    #cv：选择每次测试折数  accuracy：评价指标是准确度,可以省略使用默认值
    cv_scores.append(scores.mean())

plt.plot(k_range,cv_scores)
plt.xlabel('K')
plt.ylabel('Accuracy')
plt.show()

从图中可以看出k为3时的knn效果最好

best_knn=KNeighborsClassifier(n_neighbors=3)
best_knn.fit(train_X,train_y)
print(best_knn.score(test_X,test_y))

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

青木长风

关注关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

matlab花代码-Classification-IRIS-:使用10折交叉验证报告IRIS数据集的分类结果。从准确率结果可以看出，在150个

06-11

matlab 花代码分类-IRIS- 使用 10 折交叉验证报告 IRIS 数据集的分类结果。从准确率结果可以看出，在 150 个示例中，有些花被误分类了。代码在matlab上实现。

机器学习——鸢尾花案例——交叉验证

君莫笑的博客

03-26

6214

在同一个训练级上训练除10个不同的模型，然后在数据集上对这十个模型进行测试，得到测试集误差，以此作为模型选择得标准，选择测试误差最小得那个模型。但是凭此一次考试就对模型得好坏进行评价是不合理的，所以接下来介绍交叉验证法。 1、10折交叉验证。首先导入必要的库。 from sklearn.datasets import load_iris from sklearn.neighbors import KNeighborsClassifier from sklearn.model_selecti......

参与评论您还未登录，请先登录后发表或查看评论

机器学习算法------1.10 交叉验证，网格搜索（交叉验证，网格搜索（模型选择与调优）API、鸢尾花案例增加K值调优）

程序猿-凡白的博客

07-16

1118

文章目录1.10 交叉验证，网格搜索学习目标1 什么是交叉验证(cross validation)1.1 分析1.2 为什么需要交叉验证2 什么是网格搜索(Grid Search)3 交叉验证，网格搜索（模型选择与调优）API：4 鸢尾花案例增加K值调优5 总结 1.10 交叉验证，网格搜索学习目标目标知道交叉验证、网格搜索的概念会使用交叉验证、网格搜索优化训练模型 1 什么是交叉验证(cross validation) 交叉验证：将拿到的训练数据，分为训练和验证集。以下图为例：将数据分成

python进行KNN算法分析实战（鸢尾花数据集）

qq_55969497的博客

05-16

3034

KNN算法分析实战（鸢尾花数据集）代码效果图，废话不多说，先看看代码实验结果提示：以下是本篇文章正文内容，下面案例可供参考一、导入需要的包要是报错的话可以在pycharm安装包，要是不行就在命令窗口输入pip install +包名 import matplotlib.pyplot as plt from sklearn import neighbors import numpy as np import pandas as pd import sea..

鸢尾花数据集-数据分析.pdf

12-24

进一步，我们执行了K折交叉验证（K-fold Cross-Validation），使用`cross_val_score()`函数计算KNN模型在不同K值下的平均准确率。K折交叉验证可以减少模型评估过程中的偏差，提高模型泛化能力。在这个例子中，我们...

SVM.zip_Python 分类 SVM_accordinglrk_python SVM 分类_svm python_svm

07-15

在"14.SVM"这个压缩包文件中，可能包含了一个或多个Python脚本，用于演示如何用SVM处理实际问题，比如对花卉（可能是鸢尾花数据集，Iris dataset）进行分类。鸢尾花数据集是一个经典的数据集，通常用于教学和实验...

DecisionTree_机器学习_决策树_

10-03

首先，我们需要导入必要的库，如`sklearn.tree`和`sklearn.datasets`，后者用于加载示例数据集，例如鸢尾花数据集（iris dataset）。 ```python from sklearn.tree import DecisionTreeClassifier from sklearn....

机器学习 | 对数几率回归

Robin_hlt的博客

02-24

654

手写西瓜书中的数几率回归，用于鸢尾花数据集分类

机器学习项目1：鸢尾花分类

xfsong2012的博客

05-28

9682

等安装完Anaconda后，可以测试软件的版本。 import scipy import numpy import matplotlib import pandas import sklearn print('scipy:{}'.format(scipy.__version__)) print('numpy:{}'.format(numpy.__version__)) print('matplotlib:{}'.format(matplotlib.__version__)) print('pandas:

数据挖掘】金融风控 Task04 建模与调参

一一xi的博客

09-24

511

【数据挖掘】金融风控 Task04 建模与调参1. 常用模型对比及评估1.1. 逻辑回归与决策树模型1.2 集成方法1.2.1 bagging1.2.2 boosting1.2.3 bagging与boosting区别1.3 模型评估方法1.3.1 数据集划分条件1.3.2 数据集划分方法1.3.3 模型评价标准2. 模型训练2.1 导入数据并进行预处理2.2 使用lgb进行预测2.2.1 使用lgb进行预测2.2.2 对验证集进行预测，并画出roc曲线2.2.3 使用k折交叉验证进行模型评估2.3 模型调

第一个机器学习项目（鸢尾花分类问题）

zhangyuee19501107的专栏

07-15

6900

鸢尾花分类 1、下载和安装在Python中机器学习的各个方面的类库 2、导入数据，通过描述性分析、可视化等数据进行分析 3、创建六个模型，并从中选择准确度最高的模型 鸢尾花数据集特点： 1、所有的特征数据都是数字 2、这是一个分类问题，可以方便地通过有监督学习算法来解决问题 3、所有的特征采用相同的单位，不需要进行尺度的转换按照下面的步骤实现这个项目： (1) 导入数据 ...

《机器学习：Python实践》笔记：机器学习中的Hello World项目—鸢尾花分类详解

余欲与鱼语渔

05-03

1798

针对鸢尾花（Iris Flower）进行分类的一个项目，数据集是含鸢尾花的三个亚属的分类信息，通过机器学习算法生成一个模型，自动分类新数据到这三个亚属的某一个中。项目中使用的鸢尾花数据集是一个非常容易理解的数据集，这个数据集具有以下特点： · 所有的特征数据都是数字，不需要考虑如何导入和处理数据。 · 这是一个分类问题，可以很方便地通过有监督学习算法来解决问题。 · 这是一个多分类问题，也许需要一...

Optuna参数调优Sklearn模型可视化+Roc分层抽样性能分析

witpeople的博客

04-04

4395

Optuna参数调优Sklearn模型可视化+Roc分层抽样性能分析

使用sklearn的cross_val_score进行交叉验证

热门推荐

昆兰.沃斯的博客

06-15

14万+

在构建模型时，调参是极为重要的一个步骤，因为只有选择最佳的参数才能构建一个最优的模型。但是应该如何确定参数的值呢？所以这里记录一下选择参数的方法，以便后期复习以及分享。（除了贝叶斯优化等方法）其它简单的验证有两种方法：1、通过经常使用某个模型的经验和高超的数学知识。2、通过交叉验证的方法，逐个来验证。很显然我是属于后者所以我需要在这里记录一下 sklearn 的 cross_val_sc...

使用交叉验证对鸢尾花分类模型进行调参(超参数)

蔡军帅

09-14

4544

如何选择超参数： 交叉验证：如图，大训练集分块，使用不同的分块方法分成N对小训练集和验证集。使用小训练集进行训练，使用验证集进行验证，得到准确率，求N个验证集上的平均正确率；使用平均正确率最高的超参数，对整个大训练集进行训练，训练出参数。在训练集上训练。十折交叉验证 网格搜索诸如你有多个可调节的超参数，那么选择超参数的方法通常是网...

stacking多模型融合+交叉验证对鸢尾花数据集进行分类

赴前尘

08-27

4443

stacking技术图示：完整代码： # -*- coding: utf-8 -*- from sklearn.datasets import load_iris import numpy as np from sklearn.ensemble import RandomForestClassifier from sklearn.metrics import accuracy_sco...

python决策树分类导入数据集_python中使用scikit-learn和pandas决策树进行iris鸢尾花数据分类建模和交叉验证...

weixin_39574708的博客

11-23

571

在这篇文章中，我将使用python中的决策树（用于分类）。重点将放在基础知识和对最终决策树的理解上。导入因此，首先我们进行一些导入。from __future__ import print_functionimport osimport subprocessimport pandas as pdimport numpy as npfrom sklearn.tree import DecisionT...

KFold实例：基于鸢尾花的K折交叉验证

weixin_44015047的博客

08-30

4769

本文是KFold应用的一个实例，基于鸢尾花数据做5折交叉验证，测试最优树深的一个例子。导入相应包： import pandas as pd import numpy as np from sklearn.model_selection import KFold from sklearn.datasets import load_iris from lightgbm import LGBMClas...

交叉验证机器学习鸢尾花数据集设计思路