matlab批量处理excel(CSV)文件数据

matlab 专栏收录该内容
39 篇文章 36 订阅

微信公众号:好玩的matlab

数据处理可以找我帮忙QQ:2377389590

无定金,远程讲解+数据源码+处理数据

今天是2019-1-29,参加完2019年美国大学生数学建模竞赛,小伙伴都回家了,就我一个人在寝室,太无聊了,就把在比赛中遇到的excel批处理,写一下思路(ps:其实我在比赛中 利用的是SQLServer数据库和matlab相结合的数据处理方法,但是一般情况下遇到的都是matlab对excel数据批处理,所以降低要求写了matlab对excel数据批处理,此思路都是小编凭感觉自己摸索出来的,如有错误欢迎指出)。

          今天介绍怎么批量读取excel文件的数据,首选我把excel文件名称分为以下几种情况(全凭个人经验,比如读取图片文件,txt文件思路大同小异,希望我的思路起到抛砖引玉的效果)

三维数组存储方法

1. 有规律的数值型名字


%date:2019-01-29-夜晚
%author:猪猪侠
%邮箱:2377389590@qq.com
clear %清除变量
clc%清屏
filename=dir('*.xlsx');%获取全部的.xlsx文件
n=length(filename);%文件数目
for i=2010:2010+n-1%也就是2010:2014
 %思路:声明三维数组储存数据
 %[int2str(i),'.xlsx']是为了遍历excel文件
[Num(:,:,i-2010+1),TxT(:,:,i-2010+1),Raw(:,:,i-2010+1)]=xlsread([int2str(i),'.xlsx'])
end

运行结果:

2. 有规律的数值型+相同文本的名字

%date:2019-01-29-夜晚
%author:猪猪侠
%邮箱:2377389590@qq.com
 
clear %清除变量
clc%清屏
filename=dir('*.xlsx');%获取全部的.xlsx文件
n=length(filename);%文件数目
 
for i=2015:2015+n-1%也就是2015:2019
   %思路:声明三维数组储存数据
   %['我是',int2str(i),'.xlsx']拼凑excel名称的字符串是为了遍历excel文件
   [Num(:,:,i-2015+1),TxT(:,:,i-2015+1),Raw(:,:,i-2015+1)]=xlsread(['我是',int2str(i),'.xlsx'])
end

运行结果

3. 没有规律的文本的名字

dir函数可以有调用方式为:

dir('.') 列出当前目录下所有子文件夹和文件

dir('D:\Matlab') 列出指定目录下所有子文件夹和文件

dir('*.xlsx') 列出当前目录下符合正则表达式的文件夹和文件

得到的为结构体数组每个元素都是如下形式的结构体:

        name    -- filename

        date    -- modification date

        bytes   -- number of bytes allocated to the file

        isdir   -- 1 if name is a directory and 0 if not

        datenum -- modification date as a MATLAB serial date number

%date:2019-01-29-夜晚
%author:猪猪侠
%邮箱:2377389590@qq.com
clear %清除变量
clc%清屏
filename=dir('*.xlsx');%获取全部的.xlsx文件
n=length(filename);%文件数目
for i=1:n
   name=filename(i).name;
   [Num(:,:,i),Txt(:,:,i),dict(:,:,i)]=xlsread(['',name,''])%批量读取数据
end

源码:

链接:https://pan.baidu.com/s/1iat-mzAAEmCdK4uPR0GjXQ 
提取码:yr2c 

 matlab对excel数据批处理程序改进

2019-8-7今天是七夕节也是小编的生日,大清早小编在朋友圈吃饱了狗粮,总感觉要写点什么,抽空写写博客散散心。没啥心情学习,高兴的是我收到了QQ邮箱的祝福

坚持人丑多读书的宗旨继续写自己的代码,改进excel批量读入的方法,废话少说思路和代码如下

1.无规律的excel文件名批处理:

思路:dir(‘*.格式’)一股脑读入所有相同的格式,然后对filename的结构体进行操作(具体过程往上翻,excel无规律的处理有dir函数属性的详细介绍)

无论文件名咋样的,爱咋样咋样,对于所有excel进行读入,具有普适性的文件,文件如下

代码如下 

%author:zhuweijie
%email:2377389590@qq.com
%date:2019-8-7-早
%对于的excel:无论文件名咋样的,爱咋样咋样,对于所有excel进行读入,具有普适性
clc,clear;
s=what;
p=s.path;%当前文件夹路径
filename=dir([p,'\','*.xlsx']);%拼接路径,读入all文件名
mydata=cell(1,length(filename));%初始文件元胞数组
for i=1:length(filename)
     mydata{i}=xlsread(filename(i).name);%导入数据
end

运行效果:成功读入文件和数据 

 

2.有规律的excel文件名批处理: 

 思路:1、构造文件名

            2、路径和文件名字符串拼接


%author:zhuweijie
%email:2377389590@qq.com
%date:2019-8-7-早
%对于的excel:文件名+序号
clc,clear
s=what;
p=s.path;%当前文件夹路径
filename=dir([p,'\','*.xlsx']);%拼接路径,读入all文件名
filenum=length(filename);%文件数目
mydata=cell(1,filenum);%初始文件元胞数组
for k=1:filenum
    filename=sprintf('data%02d.xlsx',k);
    %构造文件名,注:文件名的读入也可以利用字符串拼接,循环读入
    %对于data1.xlsx……data10.xlsx文件构造文件名为:sprintf('data%d.xlsx',k);
    mydata{k}=xlsread(filename);%导入数据
end

 运行效果:可以循环读入相应的文件名

读入五个excel文件的数据

注意:苹果、Linux系统的电脑运行实战案例1、2、3、4……程序会出错,给出改进方法:

1、matlab写的路径,  左斜杠要改成右斜杠,

2、xlsread要改成readmatrix,

3、xlswrite改成writecell或者writematrix 具体情况自己help 

实战案例1

2019-5-20今天没事突然想继续更新这篇博客

我首先介绍我在数据处理遇到的问题

1.我这里有93个.csv文件,要按照需求批量处理csv文件数据,然后批量输出excel文件,且文件名不变。

2.每个csv文件如下图所示,第一列的数据和第二列的“ ;”前的数据组成数据,第二列“ ;”后面数据和第三列数据按照要求组成数据

比如:6025和57组成6025.57,

          13和290组成13+290/1000=13.29

          剩下数据以此规律类推;

3.每一个数据表会有*******作为分割线,分割线前面的数据为需要按照以上方法处理的数据,分割线位置是随机变化的

难点1.字符串拼接问题(主要涉及num2str,cell2mat,chr,str2double ,find ,isnan等函数)

          2.数据文件的批量读入和输出

          3. 异常处理try......catch

代码如下: 


%author:猪猪侠 
%E-mail:2377389590@qq.com
clear %清除变量
clc%清屏
s=what;
p=s.path; %当前目录
filename=dir([p,'\data\','*.csv']);%获取data文件夹下面全部的.csv文件
n=length(filename);%文件数目
for i=1:n
   name=filename(i).name;%文件 名称遍历循环
   [Num,Txt,Raw]=xlsread([p,'\data\',name]);%读取数据
   index=find(isnan(Num(:,1)));
   %% ---------对特殊数据表进行处理-----------------------------------------------------------------------------
   try%异常出错处理
        chr=cell2mat(Raw(1:index(1,1)-1,2));
   catch 
        data1=ones(1,index(1,1)-1);%声明空间
        data2=ones(1,index(1,1)-1);%声明空间
        for j=1:index(1,1)-1
            data1(j)=str2double([num2str(cell2mat(Raw(j,1))),'.',chr(j,1:2)]); %对第一列数据和第二列数据进行字符串拼接
            data2(j)=str2double(chr(j,8:9))+str2double(num2str(cell2mat(Raw((j),3))/1000));%对第2列数据和第3列数据进行字符串拼接
        end
        data=[data1',data2'];%拼接后的数据
        xlswrite([p,'\result\',strtok(name,'.'),'.xlsx'],data)%输出特殊数据表
   end
   %% ---------对符合规范的数据表进行处理-------------------------------------------------------------------------
        data1=ones(1,index(1,1)-1);
        data2=ones(1,index(1,1)-1);
        for j=1:index(1,1)-1
            data1(j)=str2double([num2str(cell2mat(Raw(j,1))),'.',chr(j,1:2)]); 
            data2(j)=str2double(chr(j,8:9))+str2double(num2str(cell2mat(Raw((j),3))/1000));
        end
        data=[data1',data2'];
        xlswrite([p,'\result\',strtok(name,'.'),'.xlsx'],data)
end

数据我已经上传群里欢迎加群获取 

实战案例2,

前几天在家陪老舅钓鱼,没掉几条,备受打击,所以今天不去了,2019-8-16今天没事干所以继续更新这篇博客,思路如下。

     我这里有三个Excel数据文件,文件名称为无序没有规律的

       要获取三个Excel文件Data表单的全部数据,拼接在一起,然后共用一个表头,经过分析三个Data数据的列数是一样的,不一样的是行数,这样难点就是怎么动态的获取行数,然后再拼接在一起。

代码如下:

%author:zhuweijie
%email:2377389590@qq.com
%data:2019-08-15
clc,clear;
s=what;
p=s.path;%路径
filename=dir([p,'\data\','*.xlsx']);%总文件名
n=length(filename);%文件个数
for i=1:n
    name=filename(i).name;%单个文件名
    [Num,TxT,Raw]=xlsread([p,'\data\',name],'data');%读入数据
    [row(i),col(i)]=size(Raw);%动态获取数据维度大小
    Row=row-2;%去除表头
    data(1,:)=Raw(2,:);%设置表头
    if 1==i
       data(2:sum(Row(i))+1,:)=Raw(3:end,:);%如果第一次(i=1),则从第二行开始到第一个数据维度+1
    else
       data(sum(Row(1:i-1))+2:sum(Row(1:i))+1,:)=Raw(3:end,:);%如果i>1,从第i-1次数据的下一行(也就是+1)开始到i+1行
    end
    %ps:i=1的if语句可以直接去掉也可以,为了读者方便理解,所以没有删
end
xlswrite('result.xlsx',data);%输出

代码已经上传群文件

实战案例3,

今天是2019-12-28,无聊帮研究生学姐写写代码……废话少说,要求如下

要求:

每个excel里面都是要2428A这一列,我看了几个都是ATR 这一列。

92个excel弄成92列,放在一个excel里面

感谢猪猪侠,哈哈哈

代码如下:

%author:猪猪侠
%email:2377389590@qq.com
clc;clear;
s=what;
p=s.path;
file=dir([p,'\data\','*.csv']);%拼接路径,读入all文件名
% delete([p,'\result\','data.xlsx'])
filenum=length(file);%文件数目
data=cell(361,92);
for i=1:filenum
    name=file(i).name;%文件 名称遍历循环
    [Num,Txt,Raw]=xlsread([p,'\data\',name]);%读取数据
    data(:,i)=Raw(:,1214);
end
xlswrite([p,'\result\','data.xlsx'],data)%输出数据表

完整版数据可以百度云下载

链接:https://pan.baidu.com/s/1shhVYq9DUre3Nm7rG3ZXrw 
提取码:kxy9

实战 案例4

要求就是根据左边数据处理成右边数据

代码如下:

 
%author:猪猪侠 
%E-mail:2377389590@qq.com
clear %清除变量
clc%清屏
filename=dir([pwd,'\data\','*.csv']);%获取data文件夹下面全部的.csv文件
n=length(filename);%文件数目
for i=1:n
   name=filename(i).name;%文件 名称遍历循环
   [Num,Txt,Raw]=xlsread([pwd,'\data\',name]);%读取数据
   [row,col]=size(Raw);
   for j=1:row%每一个表单中行数
      index=cell2mat(strfind(Raw(j,1),' '));%strfind(S1,S2)在S1查找S2
          char_Raw=char(Raw(j,:));
          data(j,:)=[   cellstr(char_Raw( 1:(index(1)-1) )),   cellstr(char_Raw( (index(1)+1):index(2))),...
              cellstr(char_Raw( (index(2)+1):index(3))),cellstr(char_Raw( (index(3)+1):index(4))),...
              cellstr(char_Raw( (index(4)+1):length(char_Raw)))]
      clear index
   end
   xlswrite([pwd,'\result\',strtok(name,'.'),'.xlsx'],data)
end

源码 数据已经上传 群文件,自己获取

实战 案例5

有120个文件上下拼接一个整体数据

其中排序函数:sort_nat

win10+matlab2020b +office2019环境 

tic
clc,clear;
warning off
mkdir([pwd,'\result'])
filelist=dir([pwd,'\data\','*.csv']);%总文件名
n=length(filelist);%文件个数
namelist=cell(1,n);
%排序
for j=1:n
    namelist{j}=filelist(j).name; %排序
end 
sortname=sort_nat(namelist);
for i=1:n
    [Num,TxT,Raw]=xlsread([pwd,'\data\',char(sortname(i))]);%读入数据
    [row(i),col(i)]=size(Num);%动态获取数据维度大小
    Row=row;%去除表头
    if 1==i
       data(1:sum(Row(i)),:)=Raw(2:end,:);
    else
       data(sum(Row(1:i-1))+1:sum(Row(1:i)),:)=Raw(2:end,:);
    end
end
Data=[TxT;data];
xlswrite([pwd,'\result\','result.xlsx'],Data);%输出
toc

ios电脑+matlab2019b+office2019

tic
clc,clear;
warning off
mkdir([pwd,'\result'])
filelist=dir([pwd,'\data\','*.csv']);%总文件名
n=length(filelist);%文件个数
namelist=cell(1,n);
%排序
for j=1:n
    namelist{j}=filelist(j).name; %排序
end 
sortname=sort_nat(namelist);

for i=1:n
    Num=readmatrix([pwd,'\data\',char(sortname(i))]);%读入数据
    [row(i),col(i)]=size(Num);%动态获取数据维度大小
    Row=row;%去除表头
    if 1==i
       data(1:sum(Row(i)),:)=Num(1:end,:);
    else
       data(sum(Row(1:i-1))+1:sum(Row(1:i)),:)=Num(1:end,:);
    end
end
TxT={'Time','id','mass','v:0','v:1','v:2','radius','Points:0','Points:1','Points:2'};
Data=[TxT;num2cell(data)];
writecell(Data,[pwd,'\result\','result.xlsx']);%输出
toc

实战案例5的数据+源码可以加微信号:idmatlab领取

实战案例6

今天是2021年6月24,继续更新博客

要求如下

数据文件是这样的 

matlab实现代码,其中sort_nat文件字符串排序的函数可以参考: Matlab对文件名进行自然排序_猪猪侠-CSDN博客_matlab文件名排序

tic
clc,clear;
warning off
filelist=dir([pwd,'\波形输出\','*.csv']);%总文件名
n=length(filelist);%文件个数
namelist=cell(1,n);
%排序
for j=1:n
    namelist{j}=filelist(j).name; %排序
end 
sortname=sort_nat(namelist);
Data=zeros(1024,n)*NaN;
h=waitbar(0,'计算中,请稍候!');
n=100;
for i=1:n
    [Num,TxT,Raw]=xlsread([pwd,'\波形输出\',char(sortname(i))]);%读入数据
    Data(:,i)=Num;
    str=['计算中',num2str(i/n*100),'%'];
    waitbar(i/n,h,str)
end
close(h)
save Data Data
toc

matlab运行处理时间要1个小时左右, 小编觉得无聊尝试用python代码实现此功能,哇,太香了,python只要几分钟,python真香,等小编有空写另一个博客:python怎么批量处理csv、Excel、txt文件敬请期待,需要此次案例matlab代码和数据的请联系小编VX: idmatlab,matlab环境已经搭建好了,之间运行就行了(Mac系统或者linux系统除外,这个可以参考实战案例5的第二个代码和开始介绍的Mac相关事项进行适当修改code

详细的文件数据和代码已经上传群里 

实战案例7

 源码:

clc
clear
[file,path]=uigetfile('*.csv');
if file == 0
    msgbox('You have not selected any files','Error','error');
    return
end
if ~exist([pwd,'\result'],'file')
    mkdir([pwd,'\result\']);
end

[Num,TxT,Raw]=xlsread([path,file]);
len=size(Raw,1);
n=0;

for i=1:len
    if  contains(char(Raw{i,2}),'type=')
        idx_start1=strfind(char(Raw{i,3}),'=');
        idx_start2=strfind(char(Raw{i,4}),'=');
        idx_end2=strfind(char(Raw{i,4}),' ');
        n=n+1;
        % data(n,1)=str2double(Raw{i,3}(idx_start1+1:end));
        % data(n,2)=str2double(Raw{i,4}(idx_start2+1:idx_end2));
        data{n,1}=Raw{i,2};
        data{n,2}=Raw{i,3}(idx_start1+1:end);
        data{n,3}=Raw{i,4}(idx_start2+1:idx_end2);
    end
end

for j=1:n
    time(j)=str2double(cell2mat(data(j,2)));
    hight(j)=str2double(cell2mat(data(j,3)));
end
plot(time,hight,'r-o')
ylabel('Hight')
xlabel('time')
grid minor

title={'type','time','hight'};
Data=[title;data];
xlswrite([path,'result\',strtok(file,'.'),'.xlsx'],Data)

源码数据上传到:好玩的matlab/数据批量处理 - Gitee.com 

实战案例8

 

源码:

clc;clear;close all;
selpath=uigetdir(pwd,'选择文件夹');%选择文件夹
if selpath == 0
    msgbox('You have not selected any files','Error'); %如果路径没有选择返回,终止运行
    return
end

str_file=strfind(selpath,'\');% 查找选择的文件夹名称索引
file_name=selpath(str_file(end)+1:end);%提取选择的文件夹名称

if ~exist('result','file')%创建文件
    mkdir('result')
end

% selpath='.\20um\';
file=dir([selpath,'\*.txt']);%获取当前选择路径下面的所有txt
outData=cell(length(file),2);%声明空间
for j=1:length(file) %循环变量文件名称
    data_str=importdata([selpath,'\',file(j).name],'%f'); %读取txt
    str1=strsplit(data_str,'RX:AA');%对读取的txt文件进行分割
    for i=2:length(str1)
        str2=strsplit(str1{i}); %str1再一次分割
        %数据解析协议:
        data=hex2dec(str2{2})*2^16+hex2dec(str2{3})*2^8+hex2dec(str2{4})*2^0;
        if data>2^15
            data=data-65536;
        end
        
        Data(i-1)=data;
    end
    outData(j,1)={strtok(file(j).name,'.')};
    outData(j,2)=num2cell(mean(Data(2:end-2)));%??????
end
xlswrite([selpath,'\..\result\',file_name,'.xlsx'], outData)%输出

最终效果 

 

 获取数据文件可以关注:好玩的Matlab  输入关键字:20211109  就可以领取数据+code

实战案例9

源码

clc;clear;close all;
Time=datestr(now,'yyyy-mm-dd-HH-MM-SS');
folder=dir([pwd,'\data\*.xlsx']);

if ~exist('result','file')
    mkdir('result');
end

n=length(folder);
for j=1:n
    namelist{j}=folder(j).name;
    name_idx_start=strfind(namelist{j},'(');
    name_idx_end=strfind(namelist{j},')');
    name_num(j)=str2num(namelist{j}(name_idx_start+1:name_idx_end-1));
end

[~,name_idx] = sort(name_num);%名称排序
disp('-------------开始处理-----------------')
for i=1:n
    %     disp(folder(name_idx(i)).name);
    %     [Num{i},TxT{i},Raw{i}]=xlsread([pwd,'\data\',folder(name_idx(i)).name]);
    [Num,TxT,Raw]=xlsread([pwd,'\data\',folder(name_idx(i)).name]);
    for j=1:size(Raw,1)
        if   strfind(Raw{j,1},'DataValue')
            disp(['文件(',num2str(i),')的位置为:',num2str(j)])
            loc_idx(i)=j;
            Data{i}=Raw(j:end,2:4);
            break;
        end
    end
end
% DataNan=cell(size(Data{1},1),1);
for i=1:size(Data,2)
    if i==1
        NewData=Data{1};
    else
        NewData=[NewData,Data{i}] ;
    end
end
Title_name=cell(1,size(NewData,2));
for i=1:n
    Title_name(1,3*i-1)={strtok(folder(name_idx(i)).name,'.')};
end
Data_all=[Title_name;NewData];
xlswrite([pwd,'\result\',Time,'.xlsx'],Data_all);
disp(['-------------输出成功:【',Time,'.xlsx】-----------------'])

运行结果: 

 

QQ群

微信

抖音

群资料 

©️2021 CSDN 皮肤主题: Age of Ai 设计师:meimeiellie 返回首页
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值