Python中,os.listdir排序乱序,使用lambad expression解决

今天要用到python读目录里的文件,一共有23个目录,每个目录里有30000个文件,文件名是123.xml的形式。

我需要按文件名的顺序把他们读出来,os.listdir()之后文件是乱的,sort()一下出来的也是按string比较出来的结果。比如文件是 1.xml, 12.xml, 19.xml, 120.xml, 190.xml,os.listdir()之后顺序是乱的,sort之后就变成了这样的顺序: 1.xml, 12.xml, 120.xml, 19.xml, 190.xml。

看了python的docs,发现sort里面原来可以加参数,而且可以加lambda expression。这里假设扩展名是3个字符。

files = os.listdir(dirpath)
files.sort()
files.sort(key=lambda x:int(x[:-4]))

### 解决 `os.listdir` 函数导致的文件列表乱序问题 当使用 `os.listdir()` 函数读取目录中的文件时,该函数并不会保证返回的文件列表有任何特定顺序[^1]。为了确保文件按照预期顺序排列,在获取到文件列表后应对其进行显式的排序操作。 对于简单的字母或数字排序需求,可以直接利用 Python 的内置 `sorted()` 函数对文件名进行升序处理: ```python import os files = os.listdir('path/to/directory') ordered_files = sorted(files) print(ordered_files) ``` 然而,如果遇到包含编号或其他形式序列化的文件名称,则可能需要采用更加智能化的方式来进行排序。此时推荐使用第三方库 `natsort` 来实现自然排序功能,这能更好地模拟人们直观上的大小关系判断标准,比如让 'file2.txt' 排在 'file10.txt' 前面而非其后[^4]。 安装 `natsort` 库可以通过 pip 工具完成: ```bash pip install natsort ``` 接着可以在脚本中引入并应用此模块来获得经过适当调整后的有序文件列表: ```python from natsort import natsorted, ns files = os.listdir('path/to/directory') natural_sorted_files = natsorted(files, alg=ns.IGNORECASE) # 忽略大小写的自然排序 for file in natural_sorted_files: print(file) ``` 上述代码片段展示了两种不同的排序策略——一种基于纯字典序 (`sorted`) ,另一种则是考虑到了数值部分的实际意义 (`natsorted`) 。选择哪种方式取决于具体应用场景以及期望得到的结果样式。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值