【python】Python中glob.glob按照阿拉伯数字排序问题

我从崖边跌落

已于 2022-09-09 17:33:32 修改

阅读量1.5w

点赞数 20

分类专栏： TensorFlow python编程文章标签： glob python

于 2019-06-24 22:07:15 首次发布

本文链接：https://blog.csdn.net/qq_20135597/article/details/93531585

版权

TensorFlow 同时被 2 个专栏收录

14 篇文章 1 订阅

订阅专栏

python编程

11 篇文章 2 订阅

订阅专栏

python的glob模块，我们可以用它批量抓取某种格式、或者以某个字符打头的文件名。一般来说实验中跑出的实验结果可以用此函数批量抓取读入后，进行数据统计分析。

import glob
import numpy as np
import linecache
import os

filenames = glob.glob(path+"res*.txt")
//filenames = glob.glob("*.txt")
for filename in filenames:
    ···

对于res1-10000的数据文件，glob.glob中的排序往往是按照

res1.txt

res10.txt

res100.txt

```

这显然不是我们想要的顺序，甚至会影响实验结果

排序方法：

1、按名称排序：

sorted(glob.glob('*.txt'))

2、按修改时间排序：

import os
sorted(glob.glob('*.txt'), key=os.path.getmtime)

3、按大小排序：

import os
sorted(glob.glob('*.txt'), key=os.path.getsize)

我按照时间进行排序，成功得到：

4、截取文件名中的自然数排序

但是如果数据集不是自己用程序顺序生成的，这个可能不一定能彻底解决问题，因为结果文件的前缀名称一致，可以采用截取自然数的方式排序

sorted(glob.glob('res*.txt'), key=lambda name: int(name[4:]))

我从崖边跌落

关注

20
点赞
踩
37

收藏

觉得还不错? 一键收藏
5
评论
【python】Python中glob.glob按照阿拉伯数字排序问题

python的glob模块，对自然数结尾的文件排序很奇怪，通过截取自然数的方式可以实现按照自然数大小排序
复制链接

扫一扫

专栏目录