交叉验证代码 java_如何正确交叉验证

最新推荐文章于 2021-03-17 15:04:30 发布

松xixi

最新推荐文章于 2021-03-17 15:04:30 发布

阅读量160

点赞数

文章标签：交叉验证代码 java

本文链接：https://blog.csdn.net/weixin_42360972/article/details/114210485

版权

我一直在尝试使用Python和scikit-learn工具包训练ML分类器 .

首先，我在分割数据集时应用了自己的阈值(例如int(len(X)* 0.75))，并在打印指标时得到了这个结果：

precision recall f1-score support

1 0.63 0.96 0.76 23

2 0.96 0.64 0.77 36

avg / total 0.83 0.76 0.76 59

然后我使用交叉验证，以便使用以下方法更精确地查看模型的准确性：scores = cross_validation.cross_val_score(X，y，cv = 10)并获得以下分数：

Cross_val_scores = [0.66666667 0.79166667 0.45833333 0.70833333 0.52173913

0.52173913 0.47826087 0.47826087 0.52173913 0.47826087]

准确度：0.56(标准偏差：/ - 0.22)，其中精度等于平均值(分数) .

有人可以建议我如何正确解释这些分数？我理解在使用交叉验证时如何分割数据集以便在整个数据集范围内观察模型的准确性，但我想知道更多 .

例如，是否有一种方法可以分割它并获得尽可能高的准确度(例如0.79166667)，如果可以的话我怎么能这样做？

我想这是因为我的数据集中存在一个分裂，即使用这些数据训练的模型可以产生更接近的预测，对吗？

有没有办法减少相对较高的标准偏差？

感谢您的时间 .

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

松xixi

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

交叉验证 java_从R中的交叉验证（训练）数据绘制ROC曲线

weixin_28896255的博客

02-28

617

我想知道是否有一种方法可以根据使用 caret 包生成的SVM-RFE模型的交叉验证数据绘制平均ROC曲线 .我的结果是：Recursive feature selectionOuter resampling method: Cross-Validated (10 fold, repeated 5 times)Resampling performance over subset size:Vari...

weka java 交叉验证_weka交叉验证

weixin_33426866的博客

02-22

391

调用weka实现交叉验证，并搭载图形界面import weka.classifiers.Classifier;import weka.classifiers.Evaluation;import weka.classifiers.bayes.NaiveBayes;import weka.classifiers.evaluation.ThresholdCurve;import weka.core.In...

参与评论您还未登录，请先登录后发表或查看评论

交叉验证代码实现

05-24

交叉验证的实现，判定SVM分类器,bufangyiz

java 交叉验证_交叉验证 - outthinker - 博客园

weixin_34849898的博客

02-21

267

参考链接：http://blog.csdn.net/linkin1005/article/details/42869331假设我们需要从某些候选模型中选择最适合某个学习问题的模型，我们该如何选择？以多元回归模型为例：，应该如何确定k的大小，使得该模型对解决相应的分类问题最为有效？如何在偏倚(bias)和方差(variance)之间寻求最佳的平衡点？更进一步，我们同样需要知道如何在加权回归模型中选择...

交叉验证代码 java_java 交叉验证CrossValidation 完整版设计

weixin_29016833的博客

02-16

254

一、认识交叉验证(Cross-Validation):有时亦称循环估计，是一种统计学上将数据样本切割成较小子集的实用方法。于是可以先在一个子集上做分析，而其它子集则用来做后续对此分析的确认及验证。一开始的子集被称为训练集。而其它的子集则被称为验证集或测试集。WIKI交叉验证对于人工智能，机器学习，模式识别，分类器等研究都具有很强的指导与验证意义。基本思想是把在某种意义下将原始数据(data...

交叉验证代码 java,在Java中实现交叉验证

weixin_33507732的博客

02-16

194

I use Spring Roo + jpa + hibernate and I would like to implement cross-validation (validation of several fields at the same time) in my application.I am not sure how to go about implementing it. Can a...

交叉验证python代码_交叉验证以及python代码实现

weixin_39733821的博客

12-03

877

这篇文章介绍的内容是关交叉验证以及python代码实现，有着一定的参考价值，现在分享给大家，有需要的朋友可以参考一下模型选择的两种方法：正则化(典型方法)、交叉验证。这里介绍交叉验证及其python代码实现。交叉验证如果给定样本数据充足，进行模型选择的一种简单方法是随机地将数据集切分为3部分，分为训练集、验证集和测试集。训练集：训练模型验证集：模型的选择测试集：最终对模型的评估在学习到不同复杂度...

GA.rar_GA_GA java_java ga_遗传算法 java_閬椾紶绠楁硶 java

09-14

【标题】"GA.rar_GA_GA java_java ga_遗传算法 java_閬椾紶绠楁硶 java" 提供的信息表明，这是一个关于遗传算法（Genetic Algorithm，简称GA）的Java实现项目。遗传算法是一种借鉴生物进化原理的优化算法，广泛应用...

k值交叉验证 交叉验证集_了解8种交叉验证类型

weixin_26756255的博客

09-07

2895

k值交叉验证 交叉验证集Cross-Validation also referred to as out of sampling technique is an essential element of a data science project. It is a resampling procedure used to evaluate machine learning models and ...

knn.zip_KNN java_classification java_java KNN_knn_knn分类

最新发布

09-23

- **调整K值**：K值的选择对结果有显著影响，通常通过交叉验证来选择最优的K值。 - **权重分配**：考虑样本距离的远近，较近的邻居赋予更大的权重，可以改善分类性能。 5. **评估与调优**： - **评估指标**：...

交叉验证MATLAB代码

10-27

用于交叉验证的MATLAB代码，可以很好实现对数据的验证

交叉验证LOOCVmatlab代码-MachineLearning_SVM:机器学习_SVM

06-13

交叉验证LOOCV matlab代码basic_SVM Matlab 代码此页面是使用basic_SVM （基本支持向量机）函数的快速手册。此代码位于 basic_SVM是一组运行机器学习进行分类的函数。它需要一组特征和相应的类作为输入。目前它只能处理二分情况（例如，1 和 0，兄弟姐妹和无关，控制和多动症，...）。该程序探索不同特征的使用，并报告每个案例的性能（样本内和样本外）。例如，如果您的数据有 100 个特征，该程序可以帮助您探索在分类中使用 10、20、... 100 个特征的性能（您可以轻松定义要包含的特征数量和数量）。对于每个特征集，程序将数据分成两个分区（一个分区用于训练，另一个用于测试），在分区测试中优化分类器并将其用于为测试保留的新数据（分区测试）。重复 N 次并报告结果。它是如何工作的详细地说，在 N 次总运行中的每次运行 n 中，数据（特征及其对应的类：1 或 0；兄弟或不相关）被划分为 2 个样本：“训练”和“测试”，其中分区“训练”是剩下 m 个元素。默认情况下，分类器使用留一法交叉验证 (loocv) 对该分区“训练”进行优化（您可

java 交叉验证_参数选择和k折交叉验证

weixin_39594439的博客

02-24

202

出于特定原因，您的数据是否被划分为这10个分区？如果不是，您可以再次将它们连接/混洗，然后进行常规(重复)交叉验证以执行参数网格搜索 . 例如，使用10个分区和10个重复可以提供总共100个训练和评估集 . 这些现在用于训练和评估所有参数集，因此您将尝试 100 results per parameter set . average performance per parameter set...

matlab 交叉验证 代码,交叉验证代码(matlab code of cross validation) | 学步园

weixin_39613433的博客

03-17

697

%说明：下面是我自己写的matlab代码，其实matlab有自带的交叉验证代码crossvalind，见Chunhou Zheng师兄的Metasample Based Sparse Representation for Tumor提供的代码%说明：Main_gene10FOLD_1.m有，用法非常简单，和自己编写的实现的是同样的功能% 10-fold cross validation%This ...

java 交叉验证_谈谈交叉验证法(个人小结)

weixin_35823067的博客

02-21

297

一.引言给定一个数据集，划分方式一般有两种：1.把整个数据集划分成训练集和测试集。2.把整个数据集划分成为训练集、验证集和测试集(一般的比例是6:2:2，参考NG《ML》)。其中训练集用于训练出模型的参数(除超参数外的惨呼)，验证集用于模型优化，即寻找最优的超参数，测试集用于评估最终模型的泛化性能。一般而言，方式2的数据划分方式是最理想的情况，它能在训练模型的同时对模型进行调优。而方式1的划分方式...

k-折交叉验证(k-fold CrossValidation)

10-26

1万+

k-折交叉验证(k-fold crossValidation)：在机器学习中，将数据集A分为训练集（training set）B和测试集（test set）C，在样本量不充足的情况下，为了充分利用数据集对算法效果进行测试，将数据集A随机分为k个包，每次将其中一个包作为测试集，剩下k-1个包作为训练集进行训练。在matlab中，可以利用： indices=crossvalind('Kfol

python机器学习库sklearn——交叉验证（K折、留一、留p、随机）