Matlab按文件名顺序读取文件中的问题 2020-12-17

Matlab按文件名顺序读取文件名中排序的问题

环境:Matlab 2016a
系统:Windows 10

在Matlab中,常常需要批量读取一些文件,或者是读取一个文件夹下特定格式的所有文件,然后再进行下一步处理。对于一些独立的样本而言,文件读取的顺序是不会影响到数据接下来的分析处理的。而对于带有时间戳的时序数据而言,按时间顺序进行读取并进行排列是会影响到模型建立的好坏的。

Matlab中常用的读取所有文件的函数为 dir函数
使用dir函数获得指定文件夹下的指定格式文件,并存放在在一种为文件结构体数组中.这个结构体数组包含5个字段,分别为 name,date,bytes,isdir,datenum。
如下图所示。
在这里插入图片描述

这个函数的使用方法如下:

trainPath='C:\Users\1210xlsx\';    % 你存放数据文件的文件夹
train  = dir([trainPath '*.xlsx']); % 遍历该文件夹下所有xlsx格式文件
train_num = length(train);
data_all=[]
for i:train_num 
  [data,text] = xlsread([trainPath train(i).name]);  
  %  取train结构体中第i个元素的name字段作为文件名,构成文件的真实地址
  data_all=[data_all;data];         %   纵向拼接
end

但是这个读取方法有一个问题,就是Matlab使用dir函数读取文件时,它并不会完全按照文件名排列的顺序,如下图所示,在文件夹中正常排序的xlsx文件,使用dir文件读取的顺序产生了变化。

在这里插入图片描述

dir函数使用的排布顺序是通过对比文件名的字符串,通过两个文件名中第一个不相同的字符串,比较其编码顺序来排序的
例如:
对1,11,101,2进行排序,
那么排序后会变成1,101,11,2
具体排序过程:

  1. 首先判断第一个字符:分别是 1,1,1,2,在大多数编码中,1字符是排在2字符前面的,因此2这个数显然排在这四个文件中最后一个。
  2. 对第一个字符为1的三个文件进行下一步判断,即判断第二个字符,分别是 空,0,1,因此得到排序顺序为1,101,11。
  3. 最终得到顺序为:1,101,11,2

解决办法:sort_nat函数

由于在上述代码中,排序放式并不是我们所想要的按十进制数的大小这排序
为了能够按十进制的排序方式,采用sort_nat()函数,对files.name 进行排序。其中调用sort_nat()方式和sort_nat()函数内容如下:

trainPath='C:\Users\1210xlsx\';    % 你存放数据文件的文件夹
train  = dir([trainPath '*.xlsx']); % 遍历该文件夹下所有xlsx格式文件
train_num = length(train);
data_all=[]

sort_nat_name=sort_nat({
   train.name});     %使用sort_nat进行排序
 
for i:train_num 
  [data,text] = xl
评论 15
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值