产生K-folder交叉验证的代码

原创 2012年03月28日 16:11:57
	static void genKFolder(String CVFolder) {
		try {
			// String[] files = { "1.0.txt", "2.0.txt", "3.0.txt", "4.0.txt",
			// "5.0.txt", "6.0.txt", "7.0.txt", "8.0.txt", "9.0.txt",
			// "10.0.txt" };

			File dir = new File(CVFolder);

			if (dir.isDirectory()) {

				// 得到所有的文件
				File[] _files = dir.listFiles();

				List<File> files = Arrays.asList(_files);

				Collections.sort(files);
				// List list

				// 便利所有的文件
				for (File f0 : files) {
					if (f0.isDirectory() || f0.getName().startsWith("none"))// 跳过文件夹
						continue;

					// 在合并文件前加none_
					FileOutputStream fos = new FileOutputStream(CVFolder
							+ File.separatorChar + "none_" + f0.getName());

					for (File f1 : files) {
						if (f1.isDirectory() || f1.getName().startsWith("none"))// jump
																				// dir
							continue;
						if (!f1.getAbsolutePath().equalsIgnoreCase(
								f0.getAbsolutePath())) {
							InputStream is = new FileInputStream(CVFolder
									+ File.separatorChar + f1.getName());// 其它的文件
							byte[] b = new byte[1024 * 100];
							int len;
							while ((len = is.read(b)) != -1) {
								fos.write(b, 0, len);
							}
							is.close();

						}
					}
					fos.flush();
					fos.close();
				}
			}
		} catch (Exception e) {
			e.printStackTrace();
		}
	}

	/**
	 * @param args
	 */
	public static void main(String[] args) {
		// parseExcel();
		String CVFolder = "/home/qibaoyuan/qibaoyuan/subject/crf-gener/cv_3";
		genKFolder(CVFolder);
	}

机器学习--交叉验证

转自: 交叉验证(Cross validation),有时亦称循环估计, 是一种统计学上将数据样本切割成较小子集的实用方法。于是可以先在一个子集上做分析, 而其它子集则用来做后续对此分析的确认及验证。...
  • caiye917015406
  • caiye917015406
  • 2013年08月29日 14:44
  • 3287

k-折交叉检验 (附代码)

1.概念 k-折交叉检验,k-fold cross test. 一种检验机器学习效果的方法。k取值为10时就是10折交叉检验。将数据集均分成10份,做10次检验,取平均误差为最终误差。 第i次检...
  • chuchus
  • chuchus
  • 2016年01月12日 15:10
  • 841

TensorFlow深度学习笔记 逻辑回归 实践篇

Practical Aspects of Learning 转载请注明作者:梦里风林 Github工程地址:https://github.com/ahangchen/GDLnotes 欢迎s...
  • jdbc
  • jdbc
  • 2016年07月10日 22:50
  • 3352

k-折交叉验证(k-fold CrossValidation)

k-折交叉验证(k-fold crossValidation): 在机器学习中,将数据集A分为训练集(training set)B和测试集(test set)C,在样本量不充足的情况下,为了充分利用...
  • xiao_xia_
  • xiao_xia_
  • 2011年10月26日 12:16
  • 8858

交叉验证代码(matlab code of cross validation)

%说明:下面是我自己写的matlab代码,其实matlab有自带的交叉验证代码crossvalind,见Chunhou Zheng师兄的Metasample Based Sparse Represen...
  • flyingworm_eley
  • flyingworm_eley
  • 2011年05月14日 21:08
  • 10509

机器学习——交叉验证

先来几句论文中经常用于表述交叉验证的句子: We follow previous experiment protocol and use accuracy under 10-fold cross-v...
  • VictoriaW
  • VictoriaW
  • 2016年07月18日 12:32
  • 1446

手把手教你可视化交叉验证代码,提高模型预测能力

我们试着利用代码可视化来提高模型预测能力~ 比如说,你正在编写一个漂亮清晰的机器学习代码(例如线性回归)。你的代码还不错,首先按照往常一样用 train_test_split 这样的函数...
  • Uwr44UOuQcNsUQb60zk2
  • Uwr44UOuQcNsUQb60zk2
  • 2017年10月24日 20:17
  • 127

【模型比较与选择】交叉验证方法原理及R语言代码实现

交叉验证是进行模型比较的一种有效方法。 它的基本原理如下(Kohavi,1995): (1)把原始数据集分解成 r个大小近似相等的子数据集。 (2)把第一个子数据集作为验证数据集,把其余r-1个子...
  • qq_36005436
  • qq_36005436
  • 2017年12月16日 17:04
  • 179

几种交叉验证(CrossValidation)方法

交叉验证 以下简称交叉验证(Cross Validation)为CV.CV是用来验证分类器的性能一种统计分析方法,基本思想是把在某种意义下将原始数据(dataset)进行分组,一部分做为训练集(tr...
  • zhf1234abc
  • zhf1234abc
  • 2015年07月12日 09:31
  • 947

R机器学习之交叉验证改善模型

什么事交叉验证交叉验证就是保留一部分样本集不用于训练模型,而用于预测。交叉验证的方法 50%测试集,50%训练集 缺点:只用一半数据集训练有可能丢失有用信息,即高偏差 留一法 2.1使用所有数据点...
  • u012432611
  • u012432611
  • 2015年11月27日 18:57
  • 1826
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:产生K-folder交叉验证的代码
举报原因:
原因补充:

(最多只允许输入30个字)