需求:某一文件下有未知数量的图像,随机取一定数量作为训练集,在剩余图像中再随机取一定数量作为测试集。
方法:
1、利用dir得到某路径下得文件详细信息,可以通过*.jpg过滤出图像文件。
2、利用randperm生成1:nTotal之间的随机序列,取前nTrain个位训练集,取随后nTest个位测试集。
代码如下:
function [arrayTrain, arrayTest] = GenerateRandomNumber(nTrain, nTest, strDir)
% nTrain: number of training samples e.g. 30
% nTest: number of testing samples e.g. 30
% strDir: the directory
arrayTrain = [];
arrayTest = [];
C = dir([strDir '*.jpg']);
nTotal = size(C, 1);
if nTotal <= nTrain
error('The total samples are less than training samples!');
end
array = randperm(nTotal);
arrayTrain = array(1:nTrain);
if nTotal < nTrain + nTest
arrayTest = array(nTrain + 1 : end);
else
arrayTest = array(nTrain + 1 : nTrain + nTest);
end
备注:由于之前对这方面不是太熟悉,尝试了很多方法,回头看看,都不及这个方法简便。
1、只想到rand函数的使用。rand函数只能生成0-1的均匀分布的随机数,常用生成一个1至N间随机数的方法为如floor(rand*N)+1,如果用这种方式生成,这过程中需要解决生成训练集的随机数不能重复,生成测试集的随机数自身和训练集的随机数均不能重复,会用到很多循环判断,效率极低。
2、rand结合nchoosek,ismember等函数的使用。