【所遇问题】
有一个1.5G的力数据,有7200万行需要简化,数据量太大excel难以处理,
【解决方法】
使用matlab将该数据每隔2000行提取一个改为3.6万个数据,并另存为excel
【代码过程】
fid = fopen(‘D:\temp\H13_21_12_2021\h13_3kg_81tr_min_16h37_21_12.txt’);
A = [];% 创建一个数组
tline = fgetl(fid);% 从文件中读取行,删除换行符
count = 0;% 计数变量
while ischar(tline) % ischar判断输入是否为字符数组
tline = fgetl(fid);
count = count + 1;
if mod(count-12,2000) == 0 % 从第12行开始,每隔2000行读取一行文本信息
regexp(tline,’-\d.?\d*’,‘match’); % 正则表达式,提取数字部分
A = [A;ans]; % 同一行中数字存在数组A中同一维
end
end
fclose(fid);
xlswrite(‘D:\write1.xls’,A,‘data2’)%数据存储至D盘根目录下
% D:\write1.xls 为存储路径及文件名
% A 为需要存储的数据
% data1为存储至Excel中的表单名
提取到excel后,使用offset函数进行再次提取处理,也可以一次性用matlab简化,但在excel中可以尝试多少个比较合适,
excel每隔200个提取一个使用公式为 =OFFSET($A$1,ROW(A1)*200-1,0)
参考了CSDN博主「liuyifang0810680」隔行提取代码,链接:https://blog.csdn.net/liuyifang0810680/article/details/11147911,但该代码丢失负号。
参考了1024上对正则法则的讲解,链接https://www.1024sou.com/article/240308.html