好吧,这听起来会让人感到困惑,但我会尽我所能让它足够清晰。我有一个完整的数据集fulldata,这个数据集是494021x6。匹配数据示例matlab
我使用就可以SVDS(奇异值分解)像这样:
%% dimensionality reduction
columns = 6
[U,S,V]=svds(fulldata,columns);
我然后随机从fulldata选择1000行:
%% randomly select dataset
rows = 1000;
columns = 6;
%# pick random rows
indX = randperm(size(fulldata,1));
indX = indX(1:rows)';
%# pick columns in a set order (2,4,5,3,6,1)
indY = indY(1:columns);
%# filter data
data = U(indX,indY);
我然后应用规范化该随机选择的1000行:
% apply normalization method to every cell
maxData = max(max(data));
minData = min(min(data));
data = ((data-minData)./(maxData));
然后我输出从原始数据采样伊纳勒fulldata一套1000个选择的行相匹配:
% output matching data
dataSample = fu